正则表达式「2」
字符
一,正则表达式的单字符匹配
字符 | 功能 | 示例 | 结果 |
. | 匹配任意1个字符(除了\n) |
|
|
[] | 匹配[ ]中列举的字符 |
|
'7' |
\d | 匹配数字,即[0-9] |
|
'嫦娥2号' |
\D | 匹配非数字,即不是数字 [^\d] |
|
'abc' |
\s | 匹配空白,即 空格,tab键 [<空格>\t\r\n\f\v] |
|
'a c' |
\S | 匹配非空白 [^\S] |
|
'abc' |
\w | 匹配单词字符,即a-z、A-Z、0-9、_ [a-zA-Z0-9_] |
|
'abc' |
\W | 匹配非单词字符 [^\w] |
|
'a c' |
二,原生字符串
与大多数编程语言相同,正则表达式里使用"\"作为转义字符
,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
Python里的原生字符串很好地解决了这个问题,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
ret = re.match(r"c:\\a",mm).group() print(ret) 结果:c:\a