Python模块之 urlparse 拆分 url 网址链接

作用:

  拆解 url 网址链接,协议、网络位置、路径等

必要操作:

py2:

1
2
>>> pip install urllib -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
>>> from urllib.parse import urlparse

py3:

1
2
>>> pip3 install urllib3 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
>>> from urllib3.parse import urlparse

 帮助查看:

1
2
>>> help(urllib)
>>> help(urllib3)

方法(函数):

1
2
>>> from urllib.parse import urlparse
>>> urlparse('https://www.baidu.com/a/b/c?te8=20230207&sid=tosee_jd_850d6a84e1b028270nZ529S1FFdW&fromSource=2')

 结果:

1
2
ParseResult(scheme='https', netloc='www.baidu.com', path='/a/b/c', params='', query='te8=20230207&
sid=tosee_jd_850d6a84e1b028270nZ529S1FFdW&fromSource=2', fragment='')

 

 

 

取链接路径:

1
urlparse('https://www.baidu.com/a/b/c?te8=20230207&sid=tosee_jd_850d6a84e1b028270nZ529S1FFdW&fromSource=2').path

 

 

 

注意:

python3版本:[注]
from urllib import parse
用parse.urljoin代替urlparse.urljoin

 

参考:

https://docs.python.org/zh-cn/3.10/library/urllib.parse.html

https://blog.csdn.net/qq_58487647/article/details/127702851

posted @   悟透  阅读(264)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示