正则表达式

元字符:

.           代表任意字符(\n除外)                            |           是或的关系,表示他两边的原子,只要有一个出现就可以(但“|”优先级是最低的,注意加括号)

*           用来修饰前面的原子可以出现0个1个或多个(可有可无,多了不限)          ^  或  \A  表示必须以某原子开始,这个必须放在正则表达式的最前面

+          用来修饰前面原子可以出现一个或多次(最少一次,多了不限)            $  或  \Z     表示以某原子结束,必须放在正则表达式最后面

?        用来修饰前面的原子出现0或1次(可有可无,最多一次)              ()      1.改变优先级

{n}       用来修饰前面的原子只能出现n次,多一次少一次都不行                      2.将小原子变大原子

{n,m}   用来修饰其前面的原子最少n次,最多m次                             3.子模式,整个表达式是一个大的模式,小括号里面的是每个独立的子模式

{n,}   用来修饰前面原子可以出现至少n次(没有{,n},用{0,n}代替)                  4.反向引用

                                            【】      匹配当中的任一原子

 

re模块是Python处理正则表达式的模块,其核心功能有四个:

findall,查找所有,返回列表list

finditer,查找返回,返回的是迭代器

search,搜索,搜索到第一个结果返回          #贪婪匹配和惰性匹配

March,匹配,匹配到第一个结果返回,从开始匹配    *和+多匹配    "*?"尽可能少匹配      #前面加r原样输出

posted @ 2019-01-07 11:20  jacky912  阅读(160)  评论(0编辑  收藏  举报