爬虫 贪婪匹配以及非贪婪匹配

import re

html = '''
<div><p>九霄龙吟惊天变</p></div>
<div><p>风云际汇潜水游</p></div>
'''
# 贪婪匹配
pattern = re.compile('<div><p>.*</p></div>',re.S)
r_list = pattern.findall(html)
print(r_list)

# 非贪婪匹配
pattern = re.compile('<div><p>(.*?)</p></div>',re.S)
r_list = pattern.findall(html)
print(r_list)

 

匹配任意一个字符的正则表达式:

import re
# 方法一
pattern = re.compile('.',re.S)
# 方法二
pattern = re.compile('[\s\S]')

 

匹配任意多个字符的正则表达式:

import re
# 方法一
pattern = re.compile('.*?',re.S)
# 方法二
pattern = re.compile('[\s\S]*?')
posted @ 2020-01-06 10:55  hoo_o  阅读(265)  评论(0编辑  收藏  举报