国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python爬虫 > Python中实现URL的解析

Python中实现URL的解析

头像

Python

2019-06-14 10:56:556054浏览 · 0收藏 · 0评论

在Python中的urlparse模块主要是用于解析url中的参数  对url按照一定格式进行 拆分或拼接 

1.urlparse.urlparse

将url分为6个部分,返回一个包含6个字符串项目的元组:协议、位置、路径、参数、查询、片段。

import urlparse
url_change = urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1')
print url_change

  输出结果为:

ParseResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', params='', query='opt=1', fragment='')

其中 scheme 是协议  netloc 是域名服务器  path 相对路径  params是参数,query是查询的条件

 

urlparse.parse_qs(urlparse.urlparse(url).query)

这个是获取urlparse分割后元祖中的某一项  urlparse.urlparse(url).query   获取查询条件

parse_qs 有几种实现

urlparse.parse_qs 返回字典
urlparse.parse_qsl 返回列表

 

2. urlparse.urlsplit

和urlparse差不多,将url分为5部分,返回一个包含5个字符串项目的元组:协议、位置、路径、查询、片段。

import urlparse
url_change = urlparse.urlsplit('https://i.cnblogs.com/EditPosts.aspx?opt=1')
print url_change
SplitResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', query='opt=1', fragment='')

其中 scheme 是协议  netloc 是域名服务器  path 相对路径 query是查询的条件 

 

3.urlparse.urljoin

将相对的地址组合成一个url,对于输入没有限制,开头必须是http://,否则将不组合前面。

import urlparse
new_url = urlparse.urljoin('https://baidu.com/ssss/','88888')
print new_url
输出 https://baidu.com/ssss/88888

如果输入错误信息 如  new_url = urlparse.urljoin('122','88888')    并不会将两者合并   输出‘88888’

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

金瓶风月电影高清完整版| 爱上兄弟的母亲6集免费观看| 灭火宝贝| 成都私人情侣免费看电视剧 | 暴躁少女CSGO高清大图特点| 《一滴都不许漏》何泽城林荫 | 《熟妇的荡欲》HD中字| 丫头把腿开大让我添添| 白雪公主2019| 《男医生的特殊治疗》| 医院玩弄人妻1~12章| 在线视频| 欧美片《肉欲进入》| 同学的母亲中字ID| 人野兽马狗猪大全| 在线天堂WWW在线观看图片| 欧美精品99久久久啪啪| 乱公伦媳..HH| 双男真人免费观看完整版高清| 腿张开我要添到你高潮H漫画软件| 扌暴辶鬲和扌暴辶的区别| 徐婷被房东揉到高潮的视频| 《破外女》高清完整版| 夹腿高潮后注意力不集中能恢复吗 | 出门忘穿胸罩乳头凸起怎么办| 前女友结婚了补一炮| 九九在线观看免费播放大全电视剧| 妈妈和女儿齐上阵的播出时间| 混合交换5HD| 《湿点》未增减板相似| 阿宾传奇| 搜酷| 日韩大片PPT免费PPT| 《訾花交换做爰》| 欧美XBOX与IPHONE| 老头握住淑蓉双乳| 第一次和公翁做爰又大又粗| 日本双人xX00吃奶视频| 最初的爱最后的爱| 国外成品网站1688入口在哪| 《关照丈夫的上司》大结局