Python正则表达式(阿里云大学)

Python正则表达式

正则表达式是用于信息筛选的工具,其地位非常重要

#使用格式如下
re.compile(正则表达式).findall(源字符串)
  • 基础1

    • 普通字符——正常匹配

    • \n——匹配换行符

    • \t——匹配制表符

    • \w——匹配字母、数字、下划线(也统称非特殊字符)

    • \W——匹配除字母、数字、下划线

    • \d——匹配十进制数字

    • \D——匹配除十进制数字

    • \s——匹配空白字符

    • \S——匹配除空白字符

    • [sean010]——原子表,匹配sean010中的任意一个字符

    • [^sean010]——原子表,匹配除sean010中的任意一个字符

    • 案例展示

  • 基础2

    • .——匹配除换行外任意一个字符

    • ^——匹配开始位置

    • $——匹配结束位置

    • *——前一个字符出现0\1\多次

    • ?——前一个字符出现0\1次

    • +——前一个字符出现1\多次

    • {n}——前一个字符恰好出现n次

    • {n,}——前一个字符出现至少n次

    • {n,m}——前一个字符出现至少n次,至多m次

    • |——模式选择符或

    • ()——模式单元,想要什么内容就写什么

    • 案例展示

注意上图*默认是贪婪,即尽可能多地匹配

  • 基础3

    • 贪婪模式(默认)

    • 懒惰模式(精准模式),出现下面两种组合即为懒惰模式

      • *?
      • +?
    • 案例展示

上面一种为贪婪模式,下面一种为懒惰模式。

  • 基础4

    • 模式修正符:在不改变正则表达式的情况下,通过模式修正符使得匹配结果发生更改

      • re.S——让.可以匹配多行
      • re.I——让匹配时忽略大小写(不是小写L,是大写I)
    • 案例展示

posted @ 2020-02-26 00:46  轩瑞  阅读(198)  评论(0编辑  收藏  举报
Live2d Test Env