python-re

import re

第一部分:

出现个数:

1.‘*’前面的匹配串出现0-无穷次

2.‘+’出现1-无穷次

3.‘?’出现0次到1次

4.{m,n}出现m次到n次

5.{m,n}?m到n里面出现的最低次数

比如re.serach('a{2,4}?','aaaa')则是aa

6.'$'表示结尾,以前面的匹配串结尾,注意一般用serach

7.‘^’表示开头

第二部分:

出现类型:

1.‘\w’表示任何字母和数字,\W非数字

2.'\d'只表示数字,\D表示非数字

3.'.'表示任何字符,不包括换行符号

4.'()'表示一个元组,相当与括号里看作一个整体

第三部分:

几个重要的方法:

1.match():从头开始匹配

2.search():任何地方

3.findall()返回一个元组,只针对()的

4.group()返回匹配的结果

5.sub(x,y,string):x要代表被替换的字符,y代表代替x的字符,string只有地方需要替换的字符串

6.subn(),返回替换的个数

7.start(),end(),代表出去匹配字符串之后,字符串剩下部分的头和尾巴

>>> email = "tony@tiremove_thisger.net"

>>> m = re.search("remove_this", email)

>>> email[:m.start()] + email[m.end():]

'tony@tiger.net'

posted @ 2012-05-11 17:01  RINA  阅读(290)  评论(0编辑  收藏  举报