正则表达式


#正则表达式(已经客观存在的) ----》字符串匹配的
#python中的正则表达式必须导入re模块
#字符组:[字符组 ] [a-z]:匹配 a-z
#[0-9a-fA-F]:可以匹配数字,大小写形式的a~f,用来验证十六进制字符

 

 


#非贪婪匹配:量词的后面再加上一个?,,,能少匹配就少匹配,但正则表达式中默认是贪婪匹配,能多匹配就要多匹配。
#<.*>贪婪匹配
#<.*?>非贪婪匹配
#几个常用的非贪婪匹配:
  1. # *? 重复任意次,但尽可能少重复
  2. # +? 重复1次或更多次,但尽可能少重复
  3. # ?? 重复0次或1次,但尽可能少重复
  4. # {n,m}? 重复n到m次,但尽可能少重复
  5. # {n,}? 重复n次以上,但尽可能少重复

 

 


#.*?
#字符. 说明:匹配所有‘字符’的字符



#转义字符
# 正则表达式中的\\n--->\n
# r'\\n'---->在字符串之前加r,让整个字符串不转义



# .*?的用法:
  • # .:任意字符
  • # *:取零至无限长度
  • # ?:非贪婪模式
    • ----》取尽量少的任意字符,一般不会这么单独写,大多用在:.*?x 就是取前面任意长度的字符串,直到x的出现

    #正则表达式提取信息的步骤:
    1.寻找规律
    2.使用正则符号表示规律
    3.提取信息



posted @ 2019-10-29 17:04  故俗  阅读(105)  评论(0编辑  收藏  举报