爬虫贪婪匹配以及非贪婪匹配

import re

html = '''
<div><p>九霄龙吟惊天变</p></div>
<div><p>风云际汇潜水游</p></div>
'''
# 贪婪匹配
pattern = re.compile('<div><p>.*</p></div>',re.S)
r_list = pattern.findall(html)
print(r_list)

# 非贪婪匹配
pattern = re.compile('<div><p>(.*?)</p></div>',re.S)
r_list = pattern.findall(html)
print(r_list)

匹配任意一个字符的正则表达式：

import re
# 方法一
pattern = re.compile('.',re.S)
# 方法二
pattern = re.compile('[\s\S]')

匹配任意多个字符的正则表达式：

import re
# 方法一
pattern = re.compile('.*？',re.S)
# 方法二
pattern = re.compile('[\s\S]*？')

posted @ 2020-01-06 10:55 hoo_o 阅读(290) 评论(0) 收藏举报

刷新页面返回顶部

爬虫 贪婪匹配以及非贪婪匹配

公告

爬虫贪婪匹配以及非贪婪匹配