爬取的网页不管是''gbk''解码,还是''utf-8''解码,都是乱码的解决方法
遇到这种情况的通用方法,就是先转换成二进制格式,再进行编码
>>> import requests
>>> r = requests.get('http://www.baidu.com')
>>> bytes(r.text,r.encoding).decode('utf-8','ignore')
>>> import requests
>>> r = requests.get('http://www.baidu.com')
>>> bytes(r.text,r.encoding).decode('utf-8','ignore')