(参考)爬虫8-re库的match对象,贪婪匹配,最小匹配

import re
match=re.search(r'[1-9]\d{5}','BIT100081')
if match:
    print(match.group(0))
#输出 100081

type(match)#输出 _sre.SRE_Match

 

import re
m=re.search(r'[1-9]\d{5}','BIT100081 VHT167081')
if m:
    print(m.group(0))
#输出 100081

m.string#输出 'BIT100081 VHT167081'
m.re#输出 re.compile(r'[1-9]\d{5}', re.UNICODE)
m.pos #输出0
m.endpos#输出 19
m.group(0)#输出 100081
m.start()#输出3
m.end()#输出9
m.span()#输出(3,9)

re库的贪婪匹配和最小匹配

re库默认采用贪婪匹配,即输出匹配最长的子串

 如何输出最小匹配,加?号

match=re.search(r'PY.*N','PYANBNCNDN')
match.group(0)
#贪婪匹配,输出PYANBNCNDN

match=re.search(r'PY.*?N','PYANBNCNDN')
match.group(0)
#加?号后,最小匹配,输出PYAN

 

posted @ 2018-04-10 23:57  歪胡子的日常  阅读(899)  评论(0编辑  收藏  举报