Python requests 响应内容中文乱码问题解决方案

方案一:requests请求成功时,设置它的编码

1 def get_one(ur1):
2     res = requests.get(ur1)
3     res.encoding = '2312'    #编码格式
4     if res.status_code == 200:
5         return res.text
6     return None

注:前提是知道它的编码,一般通过鼠标右键网页就可以查看网页原代码

方案二:利用apparent_encoding

1 res.encoding = res.apparent_encoding if res.encoding == 'IS0-8859-1' else res.encoding
2 print(res.apparent_encoding)

注:apparent_encoding本质上是requests本身对网页源码的猜测,如果猜不到,会返回None

方案三:先解成二进制,之后再转成想要的编码方式

1 res.content.decode("utf-8", "ignore").encode("gbk", "ignore")
2 print(res.text)

方案四:修改headers里的Accept-Encoding参数,如下:

1 headers = {'Accept-Encoding':'deflate'}

 

posted on 2022-04-21 14:42  帅胡  阅读(2062)  评论(0编辑  收藏  举报

导航