python笔记正则表达式

元字符

. 通配符除了\n

^ 以什么开始的匹配

$ 以什么结尾的匹配

* 重复前一个条件,最少0个，[0,∞]

+ 重复前一个条件，最少1个，[1,∞]

？重复前面的条件，最少0个，最多1个[0,1]

{x} 重复前面的x次，x为数字，{x,y}最少x次，最多y-1次，{x,}最少x次，最多不限

| 或的意思

\ 反斜杠后跟元字符去除特殊功能

\. 就是匹配点.

\+ 匹配+

\\\\ 匹配\ 等于 r“\\"

r是代表原生字符，不需要python转义就传入re

反斜杠后跟普通字符实现特殊功能

\d 代表数字0-9 [0-9]

\D 代表非数字0-9 [^0-9]

\s 代表匹配空白字符[\t\n\r\f\v]

\S 代表匹配非空白字符 [^\t\n\r\f\v]

\w 代表匹配非空白字符[a-zA-Z0-9]

\W 代表匹配非非字母和数字[^a-zA-Z0-9]

\d 代表匹配一个特殊边界，如匹配单词

字符集

[ ]代表字符集

[a,b,c] 匹配a或b或c中任意一个

[a-z] 匹配a到z中的任意小型字母 [A-Za-z0-9]

- 代表什么到什么之间

^取反的意思，非

\ 将特殊符号转换成普通字符

注：字符集内取消元字符的特殊功能（\ ^ -除外）

[a-z,*] 匹配a-z的字母或*号,还有，号

[^a-z] 匹配非a-z的字母的所有

分组

（）代表分组

(1|2) 匹配1或2的字符

(?P<id>\w) 匹配一个字母或数字这个组的名称是ID

(:?\d+) 取消分组的权限

正则表达式方法

findall(规则,字符串) 寻找所有满足规则的元素

search(规则,字符串) 寻找第一个满足规则的元素并返回一个对象，配合group()显示匹配出的内容

match(规则,字符串) 只在开始匹配规则，满足返回对象，不满足返回None

split(规则,字符串) 通过规则分割字符串注：先匹配第一个，并分割，再从第一个分割后的匹配第二个，并分割。。。

sub(规则,新内容,字符串) 通过规则匹配字符串内容，并把匹配结果替换成新内容

compile(规则) 将规则封装一个对象中，下次可以直接用对象查询，不需要输规则

finditer(规则,字符串)将查找的结果成一个迭代器,使用next方法取,每个内容用group再取数

posted @ 2016-12-15 14:32 linuxTraveler 阅读(170) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

py学习笔记

python笔记正则表达式

元字符

字符集

分组

正则表达式方法

公告