Loading

爬取的网页不管是''gbk''解码,还是''utf-8''解码,都是乱码的解决方法

遇到这种情况的通用方法,就是先转换成二进制格式,再进行编码

>>> import requests
>>> r = requests.get('http://www.baidu.com')
>>> bytes(r.text,r.encoding).decode('utf-8','ignore')

posted @ 2018-12-13 22:05 coderplus 阅读(1064) 评论(0) 收藏举报

刷新页面返回顶部