python note 15 正则表达式
# 正则表达式 只和字符串打交道
# 正则表达式的规则
# 规则 字符串 从字符串中找到符合规则的内容
# 字符组 : [] 写在中括号中的内容,都出现在下面的某一个字符的位置上都是符合规则的
# [0-9] 匹配数字 # [a-z] 匹配小写字母 # [A-Z] 匹配大写字母 # [8-9] # [a-zA-Z] 匹配大小写字母 # [a-zA-Z0-9] 匹配大小写字母+数字 # [a-zA-Z0-9_] 匹配数字字母下滑线
# 元字符
# \w 匹配数字字母下滑线 word关键字 [a-zA-Z0-9_] # \d 匹配所有的数字 digit [0-9] # \s 匹配所有的空白符 回车/换行符 制表符 空格 space [\n\t ] # 匹配换行符 回车 \n # 匹配制表符 tab \t # 匹配空格 # \W \D \S 和\w \d \s取反 # [\s\S] [\d\D] [\w\W]是三组全集 意思是匹配所有字符 # \b 表示单词的边界
# ^ $
# ^ 匹配一个字符串的开始 # $ 匹配一个字符串的结束 # . 表示匹配 除换行符之外的所有字符 # [] 只要出现在中括号内的内容都可以被匹配 # [^] 只要不出现在中括号中的内容都可以被匹配 # 有一些有特殊意义的元字符进入字符组中会回复它本来的意义 : . | [ ] ( ) # a|b 或 符合a规则的或者b规则的都可以被匹配 # 如果a规则是b规则的一部分,且a规则比b规则要苛刻/长,就把a规则写在前面 # 将更复杂的\更长的规则写在最前面 # () 分组 表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组
# 量词
# {n}表示 这个量词之前的字符出现n次 # {n,} 表示这个量词之前的字符至少出现n次 # {n,m} 表示这个量词之前的字符出现n-m次 # ? 表示匹配量词之前的字符出现 0次 或者 1次 表示可有可无 # + 表示匹配量词之前的字符出现 1次 或者 多次 # * 表示匹配量词之前的字符出现 0次 或者 多次
# 练习题
# 匹配整数 \d+ # 匹配小数 \d+\.\d+ # 匹配小数或者整数 # \d+\.\d+|\d+ # \d+(\.\d+)? # 匹配身份证号码 : [1-9]\d{16}[\dx]|[1-9]\d{14} # [1-9]\d{14}(\d{2}[\dX])? # 正则表达式的匹配特点 : 贪婪匹配 # 它会在允许的范围内取最长的结果 # 非贪婪模式/惰性匹配 : 在量词的后面加上? # .*?x 匹配任意非换行符字符任意长度 直到遇到x就停止
# 关于字符串挪到python中的转义的问题 : 只需要在工具中测试完毕,确认可以匹配上之后,挪到python中在字符串的外面加上r,r''即可
# print(r'\\n') # print(r'\n')
#匹配年月日日期 格式2018-12-8
^[0-9]\d{0,3}-(1[0-2]|0?[1-9])-(3[01]|[12]\d|0?[1-9])$
#匹配qq号
[1-9]\d{4,11}
#11位电话号码
1[3-9]\d{9}
#长度为8-10位的用户密码:包含数字字母下划线
\w{8,10}
#匹配验证码:4位数字字母组成
[\da-zA-Z]{4}
#匹配邮箱地址
[0-9a-zA-Z][\w\-.]+@[a-zA-Z0-9\-]+(\.[a-zA-Z0-9\-]+)*\.[A-Za-z0-9]{2,6}