BeautifulSoup获取网页为乱码的解决

1、扒取网页

        req = requests.get(url = target)
        html = req.text
        bf = BeautifulSoup(html,'html.parser')
        texts = bf.find_all('a')
        print(texts)

　2、输出结果

3、F12查看原页面

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

4、估计是默认使用的编码不对，页面内容取回后先指定解码方式，试试。

代码：

        req = requests.get(url = target)
        req.encoding='utf-8' #指定编码格式，解决中文乱码显示
        html = req.text
        bf = BeautifulSoup(html,'html.parser')
        texts = bf.find_all('a')
        print(texts)

结果：

5、问题解决

posted @ 2022-05-30 16:25 方寸堂阅读(646) 评论(0) 收藏举报

刷新页面返回顶部

方寸堂

BeautifulSoup获取网页为乱码的解决

公告