正则表达式 ☞ 元字符

元字符:  

. ^   $   *  +   ?  {}  []   |   ()   \
. →  通配符,只能匹配一次
^ → 尖角符  开头(控制开头)
$ → 美元符  结尾(控制结尾)  用于控制一个字符串的开始或结尾,如:^a.... 或....a$
* + ? {} 都做同一件事重复

* → 匹配 0到多次

+ → 匹配1到多次

? → 匹配0到1次

{} → 匹配一个区间  {3}匹配三次,{3,6} 可以配置3-6次
[]  →  字符集  如:s[df]l  匹配出来的是 sdl或sfl ,如果是s[db],匹配出来的是sd,sb

re.findall('[1-9]','ww3wa8.d') 输出:['3','8] 输出所有的数字。
re.findall('[^1-9]','ww3wa8.d') 输出 ['w','w','w','a','.','d'] 输出除数字意外的字母

 

\  →  反斜杠后面跟元字符去除特殊功能。
        反斜杠后面跟普通字符实现特殊功能。
        引用序号对应的字组所匹配的字符串。

\d     匹配任何十进制数,它相当于类[0-9]
\D     匹配任何非数据字符;它相当于类[^0-9]
\s     匹配任何空白字符;它相当于类 [^ \t\n\r\f\v]
\S     匹配任何非空白字符; 它相当于类 [^ \t\n\r\f\v]
\w     匹配任何字母数据字符;它相当于类 [a-zA-Z0-9_]
\W     匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_]
\b:    匹配一个单词边界, 也就是指单词和空格间的位置。

 

posted @ 2017-09-17 11:43  幽冥狂_七  阅读(295)  评论(1编辑  收藏  举报