23 正则 与 re模块
1.re模块
re模块是python提供的⼀套关于处理正则表达式的模块.
search
match
findall
finditer
()
2.正则表达式
1.正则表达式是对字符串操作的⼀种逻辑公式. 我们⼀般使⽤正则表达式对字符串进⾏匹
配和过滤
2.字符 组字符组很简单⽤[]括起来. 在[]中出现的内容会被匹配. [abc]匹配a
或者b或者c [a-z]小写字母a-z [0-9]阿拉伯数字
3.简单元字符
. 匹配除换⾏符以外的任意字符
\w 匹配字⺟或数字或下划线
\s 匹配任意的空
\d 匹配数字
\n 匹配⼀个换⾏符
\t 匹配⼀个制表符
\b 匹配⼀个单词的结尾
^ 匹配字符串的开始
$ 匹配字符串的结尾
\W 匹配⾮字⺟或数字或下划线
\D 匹配⾮数字
\S 匹配⾮空⽩符
a|b 匹配字符a或字符b
() 匹配括号内的表达式,也表示⼀个组
[...] 匹配字符组中的字符
[^...] 匹配除了字符组中字符的所有字符
4.量词
* 重复零次或更多次
+ 重复⼀次或更多次
? 重复零次或⼀次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
5.惰性匹配和贪婪匹配
贪婪: .* .+
懒惰机制: .*?
6.分组
7.转义