代码改变世界

名余曰正则兮,字余曰灵均

2019-03-04 10:30  推了一下眼镜  阅读(670)  评论(0编辑  收藏  举报

正则表达式

\w 匹配字母,数字和下划线

\W 匹配不是字母.数字和下划线

\s 匹配任意空字白字符,等价于[\t \n \r \f]

\S 匹配任意非空字符

\d 匹配任意数字 等价于 [0-9]

\D 匹配任意非数字的字符

\A 匹配字符串开头

\Z 匹配字符串结尾,如果存在换行,只会匹配到换行前的字符串

\z 匹配字符串结尾,如果存在换行,同时还会匹配换行符

\G 匹配最后匹配完成的位置

\n 匹配一个换行符

\t 匹配一个制表符

^ 匹配一行字符串开头

$ 匹配一行字符串结尾

. 匹配任意字符,除了换行符,re.DOTALL 标记指定时,则可以匹配包括换行符的任意字符

[...] 用来表示一组字符,单独列出,比如[amk] 匹配a.m或k

[^ ...] 不在[]中的字符,比如[^abc]匹配除了a,b,c之外的字符

* 匹配0个或多个字符

+ 匹配一个或多个字符

? 匹配0个或1个前面的正则表达式定义的片段,非贪婪方式

{n} 精确匹配n个前面的表达式

{n,m} 匹配n到m次由前面正则表达式定义的片段,贪婪方式

a|b 匹配a或b

() 匹配括号内的内容,也表示一个组