随笔- 698 文章- 2 评论- 683 阅读- 85万

(转)利用Beautiful Soup去抓取p标签下class=jstest的内容

1.利用Beautiful Soup去抓取p标签下class=jstest的内容

复制代码

import io
import sys
import bs4 as bs
import urllib.request

# 改变标准输出的默认编码为utf-8
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf8')

# 获取该页面编码并解码成utf-8
sauce = urllib.request.urlopen(
    'http://flask.showerlee.com/scrapingtest/').read().decode('utf-8')

# 利用BS抓取页面源代码,并利用lxml规范格式
soup = bs.BeautifulSoup(sauce, 'lxml')

js_test = soup.find('p', class_='jstest')

print(js_test.text)

复制代码

参考：http://www.showerlee.com/archives/2109

利用Beautiful Soup+Pandas+Pyqt5+Selenum进行python爬虫

posted @ 2019-08-22 14:25 littlevigra 阅读(988) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App

公告

昵称： littlevigra
园龄： 7年5个月
粉丝： 20
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:centos7.2 mariadb主从复制配置快速部署 + 主从延迟 Seconds_Behind_Master + Slave_IO_Running + Slave_SQL_Running
【MySQL】请不要用SECONDS_BEHIND_MASTER来衡量MySQL主备的延迟时间搭建主备的复制，临时断开主库的网络，并 kill 掉主库 MySQL 的 binlog dump 线程。...
--littlevigra
2. Re:mysql --single-transaction 在从库导入完数据以后要在配置文件/etc/my.cnf 中加上read_only=1的参数
为了配置主从，使用 --master-data 参数时设置为1，会会启用 --lock-all-tables 选项；单纯为了备份的话，--master-data 参数设置为2就行，加--single...
--littlevigra
3. Re:mysql误删（drop）库后恢复操作引擎区别性能
此外，使用 --master-data 参数时，需要注意以下几点：该参数会自动关闭 --lock-tables 选项，并且在没有指定 --single-transaction 的情况下，会启用 --...
--littlevigra
4. Re:rsync + mysql + gzip + --single-transaction
此外，使用 --master-data 参数时，需要注意以下几点：该参数会自动关闭 --lock-tables 选项，并且在没有指定 --single-transaction 的情况下，会启用 --...
--littlevigra
5. Re:mysql --single-transaction 在从库导入完数据以后要在配置文件/etc/my.cnf 中加上read_only=1的参数
此外，使用 --master-data 参数时，需要注意以下几点：该参数会自动关闭 --lock-tables 选项，并且在没有指定 --single-transaction 的情况下，会启用 --...
--littlevigra