正则表达式贪婪模式和非贪婪模式

因为之前在学正则表达式的时候没有特别重视,导致在后面学习写爬虫的时候,因为一个简单的错误而整的满脸懵,报错信息如下:

后来按照报错的提示看了下,说是re.compile生成的pattern有问题,然后就在pattern的匹配内容里面一直找错,最后也终于是发现了错误:

。。。。。

之后就又去认真的百度了一下非贪婪模式这个东西

 

学习:

Python中正则表达式的数量词(\d,' * '等)默认是贪婪的,在匹配成功的前提下,它总是尝试匹配尽可能多的字符,非贪婪模式正好相反,它总是尝试匹配尽可能少的字符

 

例如,正则表达式“ab*",如果用于查找’abbbc',就会找到‘abbb’。如果使用非贪婪数量词‘ab*?’,就会找到"a"

 

若要使用非贪婪模式的话,只需要在量词后面直接加上一个问号”?”即可

 

posted @ 2019-06-03 18:01  进击的小小白呀  阅读(820)  评论(0编辑  收藏  举报