python-re
import re
第一部分:
出现个数:
1.‘*’前面的匹配串出现0-无穷次
2.‘+’出现1-无穷次
3.‘?’出现0次到1次
4.{m,n}出现m次到n次
5.{m,n}?m到n里面出现的最低次数
比如re.serach('a{2,4}?','aaaa')则是aa
6.'$'表示结尾,以前面的匹配串结尾,注意一般用serach
7.‘^’表示开头
第二部分:
出现类型:
1.‘\w’表示任何字母和数字,\W非数字
2.'\d'只表示数字,\D表示非数字
3.'.'表示任何字符,不包括换行符号
4.'()'表示一个元组,相当与括号里看作一个整体
第三部分:
几个重要的方法:
1.match():从头开始匹配
2.search():任何地方
3.findall()返回一个元组,只针对()的
4.group()返回匹配的结果
5.sub(x,y,string):x要代表被替换的字符,y代表代替x的字符,string只有地方需要替换的字符串
6.subn(),返回替换的个数
7.start(),end(),代表出去匹配字符串之后,字符串剩下部分的头和尾巴
>>> email = "tony@tiremove_thisger.net"
>>> m = re.search("remove_this", email)
>>> email[:m.start()] + email[m.end():]
'tony@tiger.net'