python正则表达式
python正则表达式中的特殊字符:
^ 表示匹配的字符必须在最前边
$ 表示匹配的字符必须在最后边
* 匹配* 前面的字符0次或n次
+ 匹配+ 前面的字符1次或n次
? 匹配?前面的字符0次或1次
. (小数点)匹配除换行符外的所有字符
(x) 匹配x并记录匹配的值
x|y 匹配x或者y
{n} 这里n是一个正整数。匹配前面的n个字符
{n,} 这里n是一个正整数。匹配至少n个前面的字符
{n,m} 这里n和m都是正整数。匹配至少n个、最多m个前面的字符
[xyz] 字符列表,匹配表中的任一字符,可以通过连接字符 - 指出字符范围,如 [a-z] 表示所有小写字符
[b] 匹配一个空格
b 匹配一个单词的分界线,比如一个空格
B 匹配一个单词的非分界线
re模块匹配规则(re.match函数的第三个参数):
re.IGNORECASE 忽略文中的大小写
re.LOCALE 处理字符集本地化
re.MULTILINE 是否支持多行匹配
re.DOTALL 匹配一些特殊标记,例如使用.匹配\n等字符
re.VERBOSE 忽略正则表达式中的空格或者换行等字符
re.UNICODE 使用Unicode编码
以下是一个匹配邮箱的例子
def isEmail(email): isMatch = bool(re.match(r"^([a-zA-Z]+)([0-9]*)@([a-z0-9A-Z]+\.)+[a-zA-Z]{2,}$", email, re.IGNORECASE)) if isMatch: print "email is correct." else: print "email is wrong." return isMatch