正则表达式
元字符:
. 代表任意字符(\n除外) | 是或的关系,表示他两边的原子,只要有一个出现就可以(但“|”优先级是最低的,注意加括号)
* 用来修饰前面的原子可以出现0个1个或多个(可有可无,多了不限) ^ 或 \A 表示必须以某原子开始,这个必须放在正则表达式的最前面
+ 用来修饰前面原子可以出现一个或多次(最少一次,多了不限) $ 或 \Z 表示以某原子结束,必须放在正则表达式最后面
? 用来修饰前面的原子出现0或1次(可有可无,最多一次) () 1.改变优先级
{n} 用来修饰前面的原子只能出现n次,多一次少一次都不行 2.将小原子变大原子
{n,m} 用来修饰其前面的原子最少n次,最多m次 3.子模式,整个表达式是一个大的模式,小括号里面的是每个独立的子模式
{n,} 用来修饰前面原子可以出现至少n次(没有{,n},用{0,n}代替) 4.反向引用
【】 匹配当中的任一原子
re模块是Python处理正则表达式的模块,其核心功能有四个:
findall,查找所有,返回列表list
finditer,查找返回,返回的是迭代器
search,搜索,搜索到第一个结果返回 #贪婪匹配和惰性匹配
March,匹配,匹配到第一个结果返回,从开始匹配 *和+多匹配 "*?"尽可能少匹配 #前面加r原样输出