python正则表达式
在做接口的时候,上个接口返回的数据做为下一个接口的参数,这个时候我们可以用到正则表达式进行提取
正则表达式
正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
正则表达式常用字符
re模块
在python语言中正则表达式是通过re模块进行实现的
re模块常用方法
re.match(pattern, string, flags=0)
# match用法 re.match(pattern, string, flags=0) a = 'foo' b= 'foo ' m = re.match(a,b) # 模式匹配字符串,匹配就返回信息,不匹配就返回None,如果从开始匹配,匹配到就返回。 print(m) if m is not None: # 如果匹配,就返回匹配内容 print(m.group()) 执行结果: <re.Match object; span=(0, 3), match='foo'> foo
group()表示返回匹配对象
groups()表示返回包含唯一或者全部的元祖形式
search(pattern, string, flags=0)
# search用法 # search(pattern, string, flags=0) a = 'foo' b= 'seafood ' m = re.search(a,b) # 搜索匹配字符串,匹配就返回信息,不匹配就返回None print(m) if m is not None: # 如果匹配,就返回匹配内容 print(m.group()) 执行结果: <re.Match object; span=(3, 6), match='foo'> foo
match()和search区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
findall(pattern, string, flags=0)
# findall用法 # re.findall(pattern, string, flags=0) a = 'sea foo' b= 'sea food ' m = re.findall(a,b) # 进行匹配,发现匹配的返回一个列表,如果没有找到匹配的,则返回空列表 print(m) 代码结果: ['sea foo']
finditer(pattern, string, flags=0)
# finditer用法 # finditer(pattern, string, flags=0) b= 's3eaf1oo2d ' m = re.finditer(r'\d',b) # 返回内容存在一个迭代器中 for i in m: print(i.group()) 代码结果: 3 1 2
sub(pattern, repl, string, count=0, flags=0)
subn(pattern, repl, string, count=0, flags=0)
# sub 和subn的用法 # sub(pattern, repl, string, count=0, flags=0) # subn(pattern, repl, string, count=0, flags=0) a = 'Anjing is a test' b = 'exploit' m = re.sub('test',b,a) # 搜索和替换,返回替换内容 m1 = re.subn('test',b,a) # 搜索和替换,返回替换内容+替换总数字 print(m) print(m1) 代码结果: Anjing is a exploit ('Anjing is a exploit', 1)
两者区别,subn返回比sub多一个替换总数字
split(pattern, string, maxsplit=0, flags=0)
# split用法 # split(pattern, string, maxsplit=0, flags=0) a = 'test1:test2:test3' m = re.split(':',a) # 已:进行分割,并返回分割数据已列表展示 print(m) 代码结果: ['test1', 'test2', 'test3']