BeautifulSoup获取网页为乱码的解决
1、扒取网页
1 2 3 4 5 | req = requests.get(url = target) html = req.text bf = BeautifulSoup(html, 'html.parser' ) texts = bf.find_all( 'a' ) print (texts) |
2、输出结果
3、F12查看原页面
1 | < meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> |
4、估计是默认使用的编码不对,页面内容取回后先指定解码方式,试试。
代码:
1 2 3 4 5 6 | req = requests.get(url = target) req.encoding = 'utf-8' #指定编码格式,解决中文乱码显示 html = req.text bf = BeautifulSoup(html, 'html.parser' ) texts = bf.find_all( 'a' ) print (texts) |
结果:
5、问题解决
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!