BeautifulSoup获取网页为乱码的解决

1、扒取网页

1
2
3
4
5
req = requests.get(url = target)
html = req.text
bf = BeautifulSoup(html,'html.parser')
texts = bf.find_all('a')
print(texts)

 2、输出结果

 

 

 3、F12查看原页面

1
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

4、估计是默认使用的编码不对,页面内容取回后先指定解码方式,试试。

代码:

1
2
3
4
5
6
req = requests.get(url = target)
req.encoding='utf-8' #指定编码格式,解决中文乱码显示
html = req.text
bf = BeautifulSoup(html,'html.parser')
texts = bf.find_all('a')
print(texts)

结果:

 

 

5、问题解决

 

posted @   方寸堂  阅读(596)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
点击右上角即可分享
微信分享提示