正则表达式

#贪婪模式:从到到尾视为一个div
result2 = re.findall('<div[\d\D]*</div>',text)#[\d]表示数字,[\D]表示除数字以外任意字符。
#非贪婪模式:每识别到一个div保持一次,即添加一个?
result3 = re.findall('<div[\d\D]*?</div>',text)

result4 = re.findall('<div.*?>',text,re.DOTALL)#re.DOTALL使.匹配所有字符,包括换行
result5 = re.findall('<div.*?</div>',text,re.S)#作用同上,缩写
result6 = re.findall('<div.*?</div>',text,re.I)#使匹配对大小写不敏感
#result1 = re.findall('<div.*</div>',text,re.L)#做本地化识别匹配
result7 = re.findall('<div.+?>',text)
result8 = re.findall('<div id="(.*?)".*?</div>',text,re.DOTALL)#()表示想要获取的字符
print(result8)
posted @   我挺猪币的  阅读(13)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示