pyhton urlparse模块

 urlparse模块提供了操作URL字符串的基本功能,包括urlparse()、urlunparse()、urljoin().

urlparse.urlparse()将URL解析成一个六元组(port_sch(网络协议下载规则)、net_loc(服务器位置)、path(限定文件或者CGI应用程序的路径)、 params(可选参数)、 query (连接符链接键值对)、frag(拆分文档中特殊描))

>>> urlparse.urlparse('http://www.baidu.com/hahah/mmm')
ParseResult(scheme='http', netloc='www.baidu.com', path='/hahah/mmm', params='', query='', fragment='')

urlparse.urlunparse()的功能与urlparse.urlparse()相反

>>> urlparse.urlunparse(urlparse.urlparse('http://www.baidu.com/hahah/mmm'))
'http://www.baidu.com/hahah/mmm'

urljoin()是将新路径与基路径链接起来

>>> urlparse.urljoin('http://www.baidu.com/hhh','nn/dfas/dfa')
'http://www.baidu.com/nn/dfas/dfa'


 

posted @ 2012-10-07 11:10  forwhy  阅读(321)  评论(0编辑  收藏  举报