正则表达式
- \b单词的开头与结尾,只匹配一个位置
- ^表示查找的整个字符串的开头,$结尾
- .匹配除了换行符意外的任意字符
- *表示前面的匹配任意多次
- \d表示匹配任意数字
- \d{2}表示\d重复两次
- \d{2,5}表示\d重复至少2次,至多5次
- \s表示任意空白符,tab,换行
- \w匹配字母数字下划线汉字
- \d+匹配一个或多个
- \. \*转义字符取本身
元字符
- .匹配除换行符以外的任意字符
- \w字母数字下划线(汉字)
- \s任意空白,tab,换行
- \d匹配数字
- \b匹配单词的开始和结束
- ^匹配要查找的开始(不同另参)
- $匹配要查找的结束(不同另参)
重复选中
- *选中0次和任意次
- +至少重复一次或多次
- ?重复0次或一次
- {n}重复n次
- {n,}重复n次或更多次
- {n,m}重复n次到m次
- [aeiou]其中的任意一个
- [0-9A-Za-z]
- |或分支条件
- (\d\d){2}分组
函数
inport re
- pattern=re.compile(r'正则')#预编译
- value=re.split(pattern,string,模式)#分割
- m=re.match(pattern,string)#成功返回Match对象,失败None
- pattern中含括号()#分组提取子串,m.group(0)本身,m.group(1)第一个等等
- 默认贪婪匹配,匹配任意多的字符