python中re模块的使用以及一些正则表达式的总结

一、re模块的使用-常用方法

match(pattern, string, flags = 0)  从string的第一个字符来匹配。如果匹配成功,返回匹配对象,否则返回None,匹配结果可以用group方法获取

import re 
c = re.match('[0-9]+[a-z]+', 'a99aaa')
print(c.group(0))

结果:

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-5-3b2f2f09c3e5> in <module>()
1 import re
2 c = re.match('[0-9]+[a-z]+', 'a99aaa')
----> 3 print(c.group(0))

  AttributeError: 'NoneType' object has no attribute 'group'

import re 
c = re.match('[0-9]+[a-z]+', '99aaa')
print(c.group(0))

结果:
99aaa

 

search(pattern, string ,flags = 0)      匹配字符串中第一次出现的符合正则的子串,没有从第一个字符匹配的限制。如果匹配成功,则返回匹配对象,否则返回None

import re 
c = re.search('[0-9]+[a-z]+', 'aa99aaa')
print(c.group(0))
结果:
99aaa

 

findall(pattern, string[,flags] )          查找字符串中所有(非重复)出现的正则表达式模式,并返回一个匹配列表

 

import re 
c = re.findall('[0-9]+[a-z]+', 'aa99aaa88bb77cc')
print(c)
结果:
['99aaa', '88bb', '77cc']

 

 

finditer(pattern, string[,flags] )        与findall()相同,但返回的是一个迭代器。对于每一次成功匹配,迭代器都会返回一个匹配对象

import re 
c = re.finditer('[0-9]+[a-z]+', 'aa99aaa88bb77cc')
for i in c:
    print(i.group(0))
结果:
99aaa
88bb
77cc

 

split(pattern, string, max = 0)         根据正则表达式的模式分隔符,split函数将字符串分割为列表,返回匹配列表,分割最多操作max次

import re 
c = re.split('[0-9]+', 'aa99aaa88bb77cc', 2)
print(c)
结果:
['aa', 'aaa', 'bb77cc']

 

compile(pattern)       生成一个规则模式,返回一个正则表达式对象

 

import re 
c = re.compile('[0-9]+[a-z]+')
r = re.findall(c, 'aa99aaa88bb')
print(r)
结果:
['99aaa', '88bb']

 以上方法中的flags参数为匹配模式,如下:

1).re.I(re.IGNORECASE): 忽略大小写
2).re.M(MULTILINE): 多行模式,改变’^’和’$’的行为
3).re.S(DOTALL): 点任意匹配模式,改变’.’的行为,使其可以匹配'\n'
4).re.L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
5).re.U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
6).re.X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释 

 

二、常用正则

  • ip:  (?:[0-9]{1,3}\.){3}[0-9]{1,3}
  • 邮箱: [a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+
  • 手机号:1[0-9]{10}

 

posted @ 2019-08-08 13:22  上帝是个单身汪  阅读(408)  评论(0编辑  收藏  举报