原文链接:http://www.one2know.cn/python6/
简介
- 正则表达式
Regular Expression,简称RE
语法
- 普通字符
可打印字符 + 不可打印字符
包括所有大写和小写字母,所有数字,所有标点符号以及一些其他符号
- 非打印字符
字符 |
描述 |
\cx |
Control+x,x属于[A-Z a-z] |
\f |
换页符 |
\n |
换行符 |
\s |
任何空白字符,包括空格、制表符、换页符等,等价于[\f\n\r\t\v] |
\S |
任何非空白字符 |
\t |
制表符 |
\v |
垂直制表符 |
\r |
回车符 |
- 特殊字符
放到匹配字符的后边,有特殊的含义,要相匹配他们要加反斜杠转义
字符 |
描述 |
$ |
输入字符串的结尾位置,特殊的:\n \r |
( ) |
标记一个子表达式的开始和结束位置 |
* |
前面的子表达式零次或多次 |
+ |
前面的子表达式一次或多次 |
. |
除换行符 \n 之外的任何单字符 |
[ ] |
标记一个中括号表达式 |
? |
前面的子表达式零次或一次,非贪婪的,尽可能匹配短的 |
\ |
转义 |
^ |
输入字符串的开始位,特殊的:\n \r |
|
限定符表达式的开始 |
| |
指明两项之间的一个选择 |
- 限定符
指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
字符 |
描述 |
* |
前面的子表达式零次或多次 |
+ |
前面的子表达式一次或多次 |
? |
前面的子表达式零次或一次 |
|
匹配确定的 n 次 |
|
至少匹配n 次 |
|
最少匹配 n 次且最多匹配 m 次 |
字符 |
描述 |
^ |
输入字符串的开始位,特殊的:\n \r |
$ |
输入字符串的结尾位置,特殊的:\n \r |
\b |
匹配一个单词边界,即字与空格间的位置 |
\B |
非单词边界匹配 |
其他的元字符
字符 |
描述 |
(pattern) |
匹配 pattern 并获取这一匹配 |
(?:pattern) |
匹配 pattern 但不获取匹配结果 |
(?=pattern) |
正向肯定预查 |
(?!pattern) |
正向否定预查 |
(?<=pattern) |
反向肯定预查,与正向肯定预查类似,只是方向相反 |
(?<!pattern) |
反向否定预查,与正向否定预查类似,只是方向相反 |
x |
y |
[xyz] |
字符集合,匹配所包含的任意一个字符 |
[^xyz |
负值字符集合,匹配未包含的任意字符 |
[a-z] |
字符范围,匹配指定范围内的任意字符 |
[^a-z] |
负值字符范围,匹配任何不在指定范围内的任意字符 |
\d |
匹配一个数字字符,等价于 [0-9] |
\D |
匹配一个非数字字符,等价于 [^0-9] |
\w |
匹配字母、数字、下划线。、,等价于 [A-Za-z0-9_] |
\W |
与\w相反,等价于 [^A-Za-z0-9_] |
\num |
匹配num个,其中 num 是一个正整数,对所获取的匹配的引用。如,'(.)\1' 匹配两个连续的相同字符。 |
运算符优先级
优先级相同的从左到右运算
运算符 |
描述 |
\ |
转义符 |
()[] |
括号 |
* , +, ?, {n}, {n,}, |
限定符 |
^, $, \任何元字符、任何字符 |
位置和序列 |
| |
或 |
常用表达式
数字
字符
其他