在爬虫过程中出现乱码,那么如何处理?

在爬虫中很容易出现乱码现象,那么具体如何处理呢?以下有几种方式,记录下。

方式一:给响应对象添加encoding

 

response = request.get(url=url,headers=headers)
response.encoding = "utf-8"

 

 

 

 

或者手动指定网页编码:

 

# 手动设定响应数据的编码格式
response.encoding = response.apparent_encoding

 

 

 

 方式二:将requests.get().text改为requests.get().content

 

 方法三:使用通用的编码方法

img_name.encode('iso-8859-1').decode('gbk')

 

 

posted on 2022-12-11 14:13  一先生94  阅读(374)  评论(0编辑  收藏  举报

导航