python re 库的使用
-
python re 库是关于正则表达式的一个库。这里面包含了多种字符串匹配的方法
-
使用例程
# -*- coding: utf-8 -*-
import re
# search 的作用是 查找后面字符中,存在前面字符的情况
m = re.search('[0-9]', "abcd4ef5")
print(m.group(0))
这里是使用 search 查找 第二个参数里面的 [0-9] 字符
-
规则介绍
# 单个字符
. 任意一个字符
a|b a|b 字符
[afg] a,f,g里面任意一个字符
[0-7] 0-7里面任意一个字符
[a-t] a-t 里面任意一个字符
[^m] 不是 m 的字符
\s 一个空格
\S 一个非空格
\d [0-9]
\D [^0-9]
\w [0-9a-zA-Z]
\W [^0-9a-zA-Z]
# 重复
* 重复 >=0 次
+ 重复 >=1 次数
? 重复 0或者1 次
{m} 重复 m 次 a{4} = aaaa, [1-6]{2} == [1-6][1-6]
{m, n} 重复 m 次到 n 次之间
^ 代表起始位置
$ 代表结束位置
^ab.*c$ == > abrrc
# 可以快速查询,如下
m = re.search("output_(\d{4})", "output_1933.txt")
print(m)
# 结果如下
<_sre.SRE_Match object; span=(0, 11), match='output_1933'>
Read The Fucking Source Code