python之正则表达式

常用的匹配语法：

常用的匹配模式：

常用的正则表达式符号：

符号	说明
.	默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
^或\A	匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
$或\Z	匹配字符结尾，或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以
*	匹配号前的字符0次或多次，re.findall("ab","cabb3abcbbac") 结果为['abb', 'ab', 'a']
+	匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
?	匹配前一个字符1次或0次
{m}	匹配前一个字符m次
{n,m}	匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
\|	匹配\|左或\|右的字符，re.search("abc\|ABC","ABCBabcCD").group() 结果'ABC'
(...)	分组匹配，re.search("(abc){2}a(123\|456)c", "abcabca456c").group() 结果 abcabca456c
\d	匹配数字0-9
\D	匹配非数字
\w	匹配[A-Za-z0-9]
\W	匹配非[A-Za-z0-9]
s	匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
(?P<name>...)	分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday':'1993'}

两个小Tip:

1、python里的原生字符解决了 "\"问题，如匹配"\\d",只需在字符串前面加个r，写成r"\d"表示该字符串是原生字符串，无需转义。

2、compile的作用：加速，如果要多次使用同一规则来进行匹配的话，可以使用re.compile函数来将规则预编译，使用编译过返回的Regular Expression Object或叫做Pattern对象来进行查找。

posted @ 2018-01-19 11:08 Claire_xu 阅读(230) 评论(0) 收藏举报

刷新页面返回顶部

Claire_xu