requests爬虫【中文乱码】的3种解决方法
一、出现【中文乱码】的原因
使用requests库
时,选择使用的文本响应方法不合适,以至于使用【requests.text
】自动获取到的网页编码与实际网页的编码不一致,导致中文乱码。
由于习惯,使用requests库
时,常用【requests.text
】进行文本响应,
在这里请注意【requests.text
】与【requests.content
】最大的区别在于后者常用于图片和视频,且不会解码,直接以二进制形式返回。
四种文本响应方式,如下图

举例如下:

【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)