正则表达式

#贪婪模式：从到到尾视为一个div
result2 = re.findall('<div[\d\D]*</div>',text)#[\d]表示数字，[\D]表示除数字以外任意字符。
#非贪婪模式：每识别到一个div保持一次,即添加一个?
result3 = re.findall('<div[\d\D]*?</div>',text)

result4 = re.findall('<div.*?>',text,re.DOTALL)#re.DOTALL使.匹配所有字符，包括换行
result5 = re.findall('<div.*?</div>',text,re.S)#作用同上，缩写
result6 = re.findall('<div.*?</div>',text,re.I)#使匹配对大小写不敏感
#result1 = re.findall('<div.*</div>',text,re.L)#做本地化识别匹配
result7 = re.findall('<div.+?>',text)
result8 = re.findall('<div id="(.*?)".*?</div>',text,re.DOTALL)#()表示想要获取的字符
print(result8)

posted @ 2022-09-07 16:59 我挺猪币的阅读(13) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· linux fork(）

· 实验7：基于REST API的SDN北向应用实践

· 正则表达式 (.*?) 含义

· 正则表达式

· 正则表达式

阅读排行：
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单，K8s 太复杂？w7panel 让容器管理更轻松！

公告

昵称：我挺猪币的
园龄： 3年7个月
粉丝： 0
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

LINUX(1)

随笔档案

阅读排行榜