python glob模块
在python中,glob模块是用来查找匹配的文件的 ,在查找的条件中,需要用到Unix shell中的匹配规则:
* : 匹配所所有 ? : 匹配一个字符 *.* : 匹配如:[hello.txt,cat.xls,xxx234s.doc] ?.* : 匹配如:[1.txt,h.py] ?.gif : 匹配如:[x.gif,2.gif]
glob是python自带的一个操作文件的相关模块,由于模块功能比较少,所以很容易掌握。用它可以查找符合特定规则的文件路径名。使用该模块查找文件,只需要用到: “*”, “?”, “[]”这三个匹配符;
import glob def get_all(): '''获取目录[c:\\tmp]下面所有的文件''' return glob.glob('c:\\tmp\\*.*') def get_my_file(): '''获取目录[c:\\tmp]下面文件名为4个字符的文件''' return glob.glob('c:\\tmp\\????.txt') def get_batch_file(): '''获取目录[c:\\tmp]下面扩展名为\'.txt\'的文件''' return glob.glob('c:\\tmp\\*.txt') def main(): print('获取目录[c:\\tmp]下面所有的文件:') tem_files = get_all() print(tem_files) print('获取目录[c:\\tmp]下面文件名为4个字符的文件:') tem_files = get_my_file() print(tem_files) print('获取目录[c:\\tmp]下面扩展名为\'.txt\'的文件:') tem_files = get_batch_file() print(tem_files) if __name__ == '__main__': main()
如果有匹配,glob.glob(path)的结果放入一个列表中返回
如果没有匹配的,glob.glob(path)将返回一个空的list:[]
总结:python的glob模块可以对文件夹下所有文件进行遍历,并保存为一个list列表
glob 文件名模式匹配,不用遍历整个目录判断每个文件是不是符合。
函数功能:匹配所有的符合条件的文件,并将其以list的形式返回
示例:
当前文件夹下有如下文件
import glob
list = glob.glob(‘*g’)
print(list)
一、glob.glob:
返回所有匹配的文件路径列表。它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。下面是使用glob.glob的例子:
for xmlPath in glob.glob('/media/ai1/DATAPART11/LIDC-IDRI' +"/*"):
#解释:遍历指定文件夹下所有文件或文件夹
for xmlPath in glob.glob(xmlPath + "/*/*"):
#解释:遍历指定文件夹下的所有文件夹里的所有文件,/*/*可以根据文件夹层数自主设定
img_path = sorted(glob.glob(os.path.join(images, '*.npy')))
#解释:遍历文件夹下所有npy文件
import glob
#获取指定目录下的所有图片
print glob.glob(r"E:/Picture/*/*.jpg")
#获取上级目录的所有.py文件
print glob.glob(r'../*.py') #相对路径
二、glob.iglob:
获取一个可编历对象,使用它可以逐个获取匹配的文件路径名。与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而glob.iglob一次只获取一个匹配路径。这有点类似于.NET中操作数据库用到的DataSet与DataReader。下面是一个简单的例子:
import glob
#父目录中的.py文件
f = glob.iglob(r'../*.py')
print f #<generator object iglob at 0x00B9FF80>
for py in f:
print py
import glob #父目录中的.py文件 f = glob.iglob(r'../*.py') print f #<generator object iglob at 0x00B9FF80> for py in f: print py
总结:iglob与glob类似,只是这里返回值为迭代器,对于大量文件时更为省内存
import glob for name in glob.glob('dir/*'): print (name)
import glob
#用子目录查询文件 print ('Named explicitly:') for name in glob.glob('dir/subdir/*'): print ('\t', name) #用通配符* 代替子目录名 print ('Named with wildcard:') for name in glob.glob('dir/*/*'): print ('\t', name)
当需要匹配一个特定的字符,可以使用一个范围
import glob for name in glob.glob('dir/*[0-9].*'): print (name)
用问号(?)匹配任何单个的字符。
import glob for name in glob.glob('dir/file?.txt'):
print (name)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?