python学习笔记3----正则表达式

　正则表达式（RE）是通过re模块来实现的。

字符匹配：

--普通字符：

*大多数字母和字符一般都会和自身匹配。

--元字符：. ^ $ * + ? {} [] \ | ()

[]:

通常用来指定一个指标集。其中的任何一个都可以进行匹配。[0-9],[a-zA-Z0-9],[a-z]

元字符在字符集中不起作用。

补集匹配不在区间范围内的字符。

通常用来指定行首。

通常用来指定行尾。

反斜杠取消后面的元字符的特殊意思。

反斜杠后面加上不同的字符表示不同特殊意义。

{m,n}:

把前面的规则重复的次数。最少的次数，重复的次数，重复m到n次。

* :

把前面的字符重复多次，包括0到多次。

+：

前面的字符最少出现一次。

？：

前面的字符出现0次或者一次。

可以用来实现最小匹配。

｛0，｝和*等同

｛1，｝和+等同

｛0,1｝和？等同

正则表达式的编译：

import re

p= re.compile(r"^ad");

p是一个正则表达式的对象

p.findall("absd")

常用方法：

match():如果在字符串开始位置找到就返回一个对象，没有找到就返回空。

search(): 扫描字符串，找到这个re匹配的位置。

把soucrString中的符合正则表达式的替换成newStr.,count是替换次数。

re.sub(re,"newStr",sourceString)

re.subn(re,"newStr",sourceString):最后一个值表示替换的次数。

用re来切割s：

re.split(re, s)

分组：

分组一般是用小括号括起来，如果正则表达式中包含分组，则会返回分组匹配的部分，而不是返回全部正则表达式匹配的字符。

posted on 2017-04-12 04:05 gaomatlab 阅读(237) 评论(0) 收藏举报

刷新页面返回顶部