正则表达式
#正则表达式(已经客观存在的) ----》字符串匹配的
#python中的正则表达式必须导入re模块
#字符组:[字符组 ] [a-z]:匹配 a-z
#[0-9a-fA-F]:可以匹配数字,大小写形式的a~f,用来验证十六进制字符
#非贪婪匹配:量词的后面再加上一个?,,,能少匹配就少匹配,但正则表达式中默认是贪婪匹配,能多匹配就要多匹配。
#<.*>贪婪匹配
#<.*?>非贪婪匹配
#几个常用的非贪婪匹配:
- # *? 重复任意次,但尽可能少重复
- # +? 重复1次或更多次,但尽可能少重复
- # ?? 重复0次或1次,但尽可能少重复
- # {n,m}? 重复n到m次,但尽可能少重复
- # {n,}? 重复n次以上,但尽可能少重复
#.*?
#字符. 说明:匹配所有‘字符’的字符
#转义字符
# 正则表达式中的\\n--->\n
# r'\\n'---->在字符串之前加r,让整个字符串不转义
# .*?的用法:
- # .:任意字符
- # *:取零至无限长度
- # ?:非贪婪模式
- ----》取尽量少的任意字符,一般不会这么单独写,大多用在:.*?x 就是取前面任意长度的字符串,直到x的出现
#正则表达式提取信息的步骤:
1.寻找规律
2.使用正则符号表示规律
3.提取信息