Python 正则表达式

原文链接:http://www.one2know.cn/python6/

简介

  • 正则表达式
    Regular Expression,简称RE

语法

  • 普通字符
    可打印字符 + 不可打印字符
    包括所有大写和小写字母,所有数字,所有标点符号以及一些其他符号
  • 非打印字符
字符 描述
\cx Control+x,x属于[A-Z a-z]
\f 换页符
\n 换行符
\s 任何空白字符,包括空格、制表符、换页符等,等价于[\f\n\r\t\v]
\S 任何非空白字符
\t 制表符
\v 垂直制表符
\r 回车符
  • 特殊字符
    放到匹配字符的后边,有特殊的含义,要相匹配他们要加反斜杠转义
字符 描述
$ 输入字符串的结尾位置,特殊的:\n \r
( ) 标记一个子表达式的开始和结束位置
* 前面的子表达式零次或多次
+ 前面的子表达式一次或多次
. 除换行符 \n 之外的任何单字符
[ ] 标记一个中括号表达式
? 前面的子表达式零次或一次,非贪婪的,尽可能匹配短的
\ 转义
^ 输入字符串的开始位,特殊的:\n \r
限定符表达式的开始
| 指明两项之间的一个选择
  • 限定符
    指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
字符 描述
* 前面的子表达式零次或多次
+ 前面的子表达式一次或多次
? 前面的子表达式零次或一次
匹配确定的 n 次
至少匹配n 次
最少匹配 n 次且最多匹配 m 次
  • 定位符
字符 描述
^ 输入字符串的开始位,特殊的:\n \r
$ 输入字符串的结尾位置,特殊的:\n \r
\b 匹配一个单词边界,即字与空格间的位置
\B 非单词边界匹配

其他的元字符

字符 描述
(pattern) 匹配 pattern 并获取这一匹配
(?:pattern) 匹配 pattern 但不获取匹配结果
(?=pattern) 正向肯定预查
(?!pattern) 正向否定预查
(?<=pattern) 反向肯定预查,与正向肯定预查类似,只是方向相反
(?<!pattern) 反向否定预查,与正向否定预查类似,只是方向相反
x y
[xyz] 字符集合,匹配所包含的任意一个字符
[^xyz 负值字符集合,匹配未包含的任意字符
[a-z] 字符范围,匹配指定范围内的任意字符
[^a-z] 负值字符范围,匹配任何不在指定范围内的任意字符
\d 匹配一个数字字符,等价于 [0-9]
\D 匹配一个非数字字符,等价于 [^0-9]
\w 匹配字母、数字、下划线。、,等价于 [A-Za-z0-9_]
\W 与\w相反,等价于 [^A-Za-z0-9_]
\num 匹配num个,其中 num 是一个正整数,对所获取的匹配的引用。如,'(.)\1' 匹配两个连续的相同字符。

运算符优先级

优先级相同的从左到右运算

运算符 描述
\ 转义符
()[] 括号
* , +, ?, {n}, {n,}, 限定符
^, $, \任何元字符、任何字符 位置和序列
|

常用表达式

数字

字符

其他


posted @ 2019-06-28 16:03  鹏懿如斯  阅读(2129)  评论(0编辑  收藏  举报