正则表达式与re模块

正则表达式

1,元字符

  .  匹配除换行符以外的任意字符

  \w 匹配字母数字和下划线

  \d    匹配数字

  \s  匹配空白符

  \n  匹配换行符

  \t  匹配制表符

  \b   匹配单词的结尾

   ^  匹配字符串的开始

  $  匹配字符串的结尾

  \W  匹配非字母数字下划线

  \D  匹配非数字

  \S  匹配非非空白符

  ()  括号内的表达式,表示一个组

  [ ]  匹配字符组中的字符

  [^ ]  匹配除了字符组中的所有字符

2,量词

  *  重复零次或多次

  +  一次或多次

  ?  重复零次或一次

  {m}  重复m次

  {m,}  重复m次或更多次

  {m,n}  重复m到n次

3,转义符

  当我们在碰到有特殊意义的转义符,例如\n,\s就需要用到转义符,“\\n”,"\\s",也可用r,如r"\n"

4贪婪匹配与惰性匹配

  .* 贪婪匹配

  .*? 惰性匹配

5,re模块的常用方法

  

1 import re
2 print(re.findall('www.(.*).com','www.baidu.com'))   #['baidu']
3 pat='www.(.*).com'
4 ret=re.search(pat,"www.baidu.com")
5 if ret:
6     print(ret.group())      #www.baidu.com
View Code

 

posted @ 2018-09-10 19:30  若兮ruoxi  阅读(81)  评论(0编辑  收藏  举报