import requests#1、打开网站 requests.get#2、从返回的html里面找到文章的超链接地址 正则表达式匹配#3、打开文章的超链接 requests.get#4、保存到本地 写文件url = 'http://www.baidu.cn/'req = requests.get(url)print(req.text)#获取返回的内容,为字符串类型print(req.encoding)#获取网站的编码