pyhton urlparse模块
urlparse模块提供了操作URL字符串的基本功能,包括urlparse()、urlunparse()、urljoin().
urlparse.urlparse()将URL解析成一个六元组(port_sch(网络协议下载规则)、net_loc(服务器位置)、path(限定文件或者CGI应用程序的路径)、 params(可选参数)、 query (连接符链接键值对)、frag(拆分文档中特殊描))
>>> urlparse.urlparse('http://www.baidu.com/hahah/mmm')
ParseResult(scheme='http', netloc='www.baidu.com', path='/hahah/mmm', params='', query='', fragment='')
urlparse.urlunparse()的功能与urlparse.urlparse()相反
>>> urlparse.urlunparse(urlparse.urlparse('http://www.baidu.com/hahah/mmm'))
'http://www.baidu.com/hahah/mmm'
urljoin()是将新路径与基路径链接起来
>>> urlparse.urljoin('http://www.baidu.com/hhh','nn/dfas/dfa')
'http://www.baidu.com/nn/dfas/dfa'