re模块下的常用方法
import re ret = re.findall('a', 'ha ha xiao') # 返回所有满足匹配条件的结果,放在列表里 print(ret) # 结果 : ['a', 'a','a'] ret = re.search('a', 'ha ha xiao') print(ret.group()) # 结果 : 'a' # 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以 # 通过调用group()方法得到匹配的字符串,如果字符串没有匹配,则返回None。 ret = re.match('a', 'abc') # 从头开始匹配,如果正则从头开始就可以匹配上,就返回一个变量,调用group可以查看,若没有匹配上则返回None,调用group会报错 print(ret.group()) # 结果 : 'a' ret = re.split('[ab]', 'abcd') # 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割 print(ret) # ['', '', 'cd'] ret = re.sub('\d', 'H', 'hao3xing4an5', 1) # 将数字替换成'H',参数1表示只替换1个 print(ret) # haoHxing4an5 ret = re.subn('\d', 'H', 'hao3xing4an5') # 将数字替换成'H',返回元组(替换的结果,替换了多少次) print(ret) obj = re.compile('\d*') # 将正则表达式编译成为一个 正则表达式对象,规则要匹配的是多个数字 ret = obj.search('qera123efgh') # 正则表达式对象调用search,参数为待匹配的字符串 print(ret.group()) # 结果 : 123 import re ret = re.finditer('\d', 'aew3ss4686wwq') # finditer返回一个存放匹配结果的迭代器 print(ret) # <callable_iterator object at 0x7fb5c6b8fc50> print(next(ret).group()) # 查看第一个结果,注意结果是字符串类型 print(next(ret).group()) # 查看第二个结果 print([i.group() for i in ret]) # 查看剩余结果
注意:
1、findall的优先级查询
import re ret = re.findall('haohao ai (basketball|football)', 'haohao ai basketball') print(ret) # ['basketball'] 这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可 ret = re.findall('haohao ai (?:basketball|football)', 'haohao ai basketball') print(ret) # ['haohao ai basketball']
2、split的优先级查询
import re ret = re.split('\d+','haha3xiao6le') print(ret) # 结果['haha','xiao','le'] ret = re.split('(\d+)','haha3xiao6le') print(ret) # 结果['haha','3','xiao','6','le'] # 在匹配部分加上()之后输出的结果不同,加上()保留了分割元素