python re 库的使用

  • python re 库是关于正则表达式的一个库。这里面包含了多种字符串匹配的方法

  • 使用例程

    # -*- coding: utf-8 -*-

    import re

    # search 的作用是 查找后面字符中,存在前面字符的情况
    m = re.search('[0-9]', "abcd4ef5")
    print(m.group(0))
    这里是使用 search 查找 第二个参数里面的 [0-9] 字符
  • 规则介绍

    # 单个字符
    .                 任意一个字符
    a|b            a|b  字符
    [afg]         a,f,g里面任意一个字符
    [0-7]         0-7里面任意一个字符
    [a-t]            a-t 里面任意一个字符
    [^m]          不是 m 的字符
    \s            一个空格
    \S            一个非空格
    \d            [0-9]
    \D            [^0-9]
    \w            [0-9a-zA-Z]
    \W            [^0-9a-zA-Z]
    # 重复
    *         重复 >=0 次
    +         重复 >=1 次数   
    ?        重复 0或者1 次
     {m}    重复 m 次  a{4} = aaaa, [1-6]{2}  ==  [1-6][1-6]
    {m, n}  重复 m  次到 n 次之间
    ^ 代表起始位置
    $ 代表结束位置
    ^ab.*c$    == > abrrc
    # 可以快速查询,如下
    m = re.search("output_(\d{4})", "output_1933.txt")
    print(m)
    # 结果如下
    <_sre.SRE_Match object; span=(0, 11), match='output_1933'>
posted @ 2018-07-18 22:49  陈富林  阅读(3972)  评论(0编辑  收藏  举报