requests 中文乱码
问题:
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
解决办法:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url) print(req.apparent_encoding) #获取真实编码 req.encoding = "gb2312" print(req.text)
当headers中缺少指定编码类型时,requests会按照默认的"ISO-8859-1"编码格式处理,
这是一种类ASCII的编码格式、中文就会出现乱码。
如图:
用第二步先获取他真实的编码,更改默认编码格式再.text
req = requests.get(url) print(req.apparent_encoding) #获取真实编码 req.encoding = "gb2312" print(req.text)