python glob模块

在python中，glob模块是用来查找匹配的文件的，在查找的条件中，需要用到Unix shell中的匹配规则：

*     : 匹配所所有
?     : 匹配一个字符
*.*   : 匹配如：[hello.txt,cat.xls,xxx234s.doc]
?.*   : 匹配如：[1.txt,h.py]
?.gif : 匹配如：[x.gif,2.gif]

glob是python自带的一个操作文件的相关模块，由于模块功能比较少，所以很容易掌握。用它可以查找符合特定规则的文件路径名。使用该模块查找文件，只需要用到： “*”, “?”, “[]”这三个匹配符;

import glob

def get_all():
    '''获取目录[c:\\tmp]下面所有的文件'''
    return glob.glob('c:\\tmp\\*.*')

def get_my_file():
    '''获取目录[c:\\tmp]下面文件名为4个字符的文件'''
    return glob.glob('c:\\tmp\\????.txt')

def get_batch_file():
    '''获取目录[c:\\tmp]下面扩展名为\'.txt\'的文件'''
    return glob.glob('c:\\tmp\\*.txt')

def main():
    print('获取目录[c:\\tmp]下面所有的文件：')
    tem_files = get_all()
    print(tem_files)
    print('获取目录[c:\\tmp]下面文件名为4个字符的文件：')
    tem_files = get_my_file()
    print(tem_files)
    print('获取目录[c:\\tmp]下面扩展名为\'.txt\'的文件：')
    tem_files = get_batch_file()
    print(tem_files)

if __name__ == '__main__':
    main()

如果有匹配，glob.glob(path)的结果放入一个列表中返回

如果没有匹配的，glob.glob(path)将返回一个空的list:[]

总结：python的glob模块可以对文件夹下所有文件进行遍历，并保存为一个list列表

glob 文件名模式匹配，不用遍历整个目录判断每个文件是不是符合。

函数功能：匹配所有的符合条件的文件，并将其以list的形式返回

示例：
当前文件夹下有如下文件

import glob

list = glob.glob(‘*g’)
print(list)

一、glob.glob：

返回所有匹配的文件路径列表。它只有一个参数pathname，定义了文件路径匹配规则，这里可以是绝对路径，也可以是相对路径。下面是使用glob.glob的例子：

for xmlPath in glob.glob('/media/ai1/DATAPART11/LIDC-IDRI' +"/*"):
#解释：遍历指定文件夹下所有文件或文件夹

for xmlPath in glob.glob(xmlPath + "/*/*"):
#解释：遍历指定文件夹下的所有文件夹里的所有文件，/*/*可以根据文件夹层数自主设定

img_path = sorted(glob.glob(os.path.join(images, '*.npy')))
#解释：遍历文件夹下所有npy文件

import glob

#获取指定目录下的所有图片
print glob.glob(r"E:/Picture/*/*.jpg")

#获取上级目录的所有.py文件
print glob.glob(r'../*.py') #相对路径

二、glob.iglob：

获取一个可编历对象，使用它可以逐个获取匹配的文件路径名。与glob.glob()的区别是：glob.glob同时获取所有的匹配路径，而glob.iglob一次只获取一个匹配路径。这有点类似于.NET中操作数据库用到的DataSet与DataReader。下面是一个简单的例子：

import glob

#父目录中的.py文件
f = glob.iglob(r'../*.py')

print f #<generator object iglob at 0x00B9FF80>

for py in f:
    print py
import glob #父目录中的.py文件 f = glob.iglob(r'../*.py') print f #<generator object iglob at 0x00B9FF80> for py in f: print py

总结：iglob与glob类似，只是这里返回值为迭代器，对于大量文件时更为省内存

import glob
for name in glob.glob('dir/*'):
    print (name)

import glob

#用子目录查询文件
print ('Named explicitly:')
for name in glob.glob('dir/subdir/*'):
    print ('\t', name)
#用通配符* 代替子目录名
print ('Named with wildcard:')
for name in glob.glob('dir/*/*'):
    print ('\t', name)

当需要匹配一个特定的字符，可以使用一个范围

import glob
for name in glob.glob('dir/*[0-9].*'):
    print (name)

用问号(?)匹配任何单个的字符。

import glob

for name in glob.glob('dir/file?.txt'):

    print (name)

posted @ 2020-09-07 15:39 chengxuyonghu 阅读(407) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

公告

昵称： chengxuyonghu
园龄： 8年
粉丝： 9
关注： 226

+加关注

2025年3月

日

一

二

三

四

五

六

随笔档案

阅读排行榜

评论排行榜

1. docker安装部署zabbix(1)