Python Linux系统管理之查找文件
一、使用fnmatch找到特定文件
1.建立多个文本,模拟实验内容。
touch {a..z}.txt
2.查找本文件夹中所有以”.txt”结尾的文件并以列表的形式输出。
In [1]: import os In [2]: [item for item in os.listdir('.') if item.endswith('.txt')] Out[2]: ['data1.txt', 'data2.txt', 'a.txt', 'b.txt', 'c.txt', 'd.txt', 'e.txt', 'f.txt', 'g.txt', 'h.txt', 'i.txt', 'j.txt', 'k.txt', 'l.txt', 'm.txt', 'n.txt', 'o.txt', 'p.txt', 'q.txt', 'r.txt', 's.txt', 't.txt', 'u.txt', 'v.txt', 'w.txt', 'x.txt', 'y.txt', 'z.txt']
大部分情况下,使用字符串匹配查找特定的文件就能够满足需求,如果需要更佳灵活的字符串匹配,可以使用标准库fnmatch库,这个库专门用来进行文件名匹配,支持使用通配符进行字符串匹配。fnmatch支持的通配符如下所示。
* 匹配任何数量的字符 ? 匹配单个字符 [seq] 匹配了seq中的字符 [!seq] 匹配除了seq以外的任何字符 |
fnmatch这个库比较简单,只有4个函数,分别是fnmatch、fnmatchcase、filter和translate。其中最常用的是fnmatch函数。各个函数的作用如下:
fnmatch 判断文件名是否符合特定的模式; fnmatchcase 判断文件名是否符合特定的模式,不区分大小写; filter 返回输入列表中,符合特定模式的文件名列表; translate 将通配符模式转换成正则表达式。 |
3.创建四个文本,模拟实验环境
touch {a..b}1.txt {c..d}2.jpg
在Python代码中,使用fnmatch函数对当前目录下的4个文件进行匹配性测试,如下所示:
In [3]: import os In [4]: import fnmatch In [5]: os.listdir('.') Out[5]: ['.bash_logout', '.bash_profile', '.bashrc', '.cshrc', '.tcshrc', 'anaconda-ks.cfg', '.bash_history', '.pki', 'v3.0.6.zip', 'easy-rsa', '.rnd', '.pip', '.cache', '.ipython', 'data', 'data1.txt', 'data2.txt', 'a.txt', 'b.txt', 'c.txt', 'd.txt', 'e.txt', 'f.txt', 'g.txt', 'h.txt', 'i.txt', 'j.txt', 'k.txt', 'l.txt', 'm.txt', 'n.txt', 'o.txt', 'p.txt', 'q.txt', 'r.txt', 's.txt', 't.txt', 'u.txt', 'v.txt', 'w.txt', 'x.txt', 'y.txt', 'z.txt'] In [6]:
fnmatchcase函数与fnmatch函数几乎一样,只是在匹配文件名时会忽略文件名中的字母大小写。filter函数与fnmatch函数比较类似,区别在于fnmatch每次对一个文件名进行匹配判断,文件名模式为第二个参数,然后以列表的形式返回输入列表中所有符合模式的文件名,如下所示:
In [1]: import os In [2]: import fnmatch In [3]: names = os.listdir(‘.’) In [4]: names Out[4]: [‘a1.txt’, ‘b1.txt’, ‘c2.jpg’, ‘d2.jpg’] In [5]: fnmatch.filter(names,”[a-c]?.txt”)
Out[5]: [‘a1.txt’, ‘b1.txt’] In [6]: fnmatch.filter(names,”[!a-c]*”) Out[6]: [‘d2.jpg’] |
二、使用glob找到特定的文件
glob的作用相当于os.listdir加上fnmatch。使用glob后,不需要调用os.listdir获取文件列表,直接通过模式匹配即可,如下所示:
In [1]: import glob In [2]: glob.glob(‘*.txt’) Out[2]: [‘a1.txt’, ‘b1.txt’] In [3]: glob.glob(‘[a-c]?.jpg’) Out[3]: [‘c2.jpg’] In [4]: glob.glob(‘[!a-c]?.jpg’)
Out[4]: [‘d2.jpg’] |