Loading

爬取的网页不管是''gbk''解码,还是''utf-8''解码,都是乱码的解决方法

遇到这种情况的通用方法,就是先转换成二进制格式,再进行编码

>>> import requests
>>> r = requests.get('http://www.baidu.com')
>>> bytes(r.text,r.encoding).decode('utf-8','ignore')
posted @ 2018-12-13 22:05  coderplus  阅读(1053)  评论(0编辑  收藏  举报