域名拆分 tld

概念

URL

Universal Resource Locator ,统一资源定位符。

用处:用来标识互联网资源的唯一地址。

本质:提供了互联网上任一资源地址的通用表示方法。

protocol://host:port/path/file.name?parameter

红色部分合称为domain

如:http://baidu.com/index.html  ftp://example/index.pdf

 

https://www.baidu.com

TLD:顶级域——>com

SLD:二级域——>baidu

子域名:——>www

 

用Python的第三方包 tld,拆分域名信息。

from tld import get_tld, get_fld

url = 'http://www.baidu.com'

print(get_fld(url))
# baidu.com

s = get_tld("http://www.baidu.com", as_object=True)
print(s, s.domain, s.subdomain, s.fld)
print(s.parsed_url, s.parsed_url.scheme, s.parsed_url.netloc)

# com baidu www baidu.com
#
SplitResult(scheme='http', netloc='www.baidu.com', path='', query='', fragment='') http www.baidu.com

 

更多方法

 

posted @ 2019-01-07 15:01  961897  阅读(748)  评论(0编辑  收藏  举报