python---filecmp 实现文件,目录,遍历子目录的差异对比功能。
ilecmp可以实现文件,目录,遍历子目录的差异对比功能。
自带filecmp模块,无需安装。
常用方法说明
filecmp提供3个操作方法,cmp(单文件对比),cmpfile(多文件对比),dircmp(目录对比).
单文件对比,filecmp.cmp(f1,f2[,shallow])
f1 f2为文件,相同True,不同False,shallow默认为True,只根据os.stat()方法返回的文件基本信息进行对比。比如最后访问时间,修改时间,状态改变时间等,会忽略文件内容的对比,当shallow为False时,则os.stat()与文件内容同时进行校验。
1 >>>filrcmp.cmp("/temp/a1","/temp/a2") 2 >>>True 3 4 >>>filrcmp.cmp("/temp/a1","/temp/a3") 5 >>>False
多文件对比,采用filecmp.cmpfiles(dir1, dir2, common[, shallow])
比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。
目录对比,通过 filecmp(a,b[,ignore[,hide]])类创建一个目录比较对象
用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。
dircmp#提供了三个方法用于报告比较的结果: report():#只比较指定文件夹中的内容(文件与文件夹) report_partial_closure():#比较文件夹及第一级子文件夹的内容 report_full_closure():#递归比较所有的文件夹的内容
#dircmp还提供了下面这些属性用于获取比较的详细结果 left_list:#左边文件夹中的文件与文件夹列表; right_list:#右边文件夹中的文件与文件夹列表; common:#两边文件夹中都存在的文件或文件夹; left_only:#只在左边文件夹中存在的文件或文件夹; right_only:#只在右边文件夹中存在的文件或文件夹; common_dirs:#两边文件夹都存在的子文件夹; common_files:#两边文件夹都存在的子文件; common_funny:#两边文件夹都存在的子文件夹; same_files:#匹配的文件; diff_files:#不匹配的文件; funny_files:#两边文件夹中都存在,但无法比较的文件; subdirs:#将common_dirs 目录映射到新的dircmp对象,格式为字典的类型。
1 #!/usr/bin/python3 2 #coding:utf-8 3 import os,sys 4 import filecmp 5 import re 6 import shutil 7 ''' 8 校验源与备份目录的差异 9 ''' 10 11 holderlist = [] 12 def compareme(dir1,dir2): #递归获取更新项函数 13 dircomp = filecmp.dircmp(dir1,dir2) 14 only_in_one = dircomp.left_only #源目录新文件或目录 15 diff_in_one = dircomp.diff_files #不匹配文件,源目录文件已发生变化 16 dirpath = os.path.abspath(dir1) #定义源目录绝对路径 17 18 #将更新文件或目录追加到holderlist 19 [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in only_in_one ] 20 [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in diff_in_one ] 21 if len(dircomp.common_dirs) > 0: #判断是否存在相同子目录,以便递归 22 for item in dircomp.common_dirs: #递归子目录 23 compareme(os.path.abspath(os.path.join(dir1,item)),os.path.abspath(os.path.join(dir2,item))) 24 return holderlist 25 26 def main(): 27 if len(sys.argv) > 2: #输入源目录与备份目录 28 dir1 = sys.argv[1] 29 dir2 = sys.argv[2] 30 else : 31 print('Usage:',sys.argv[0],'datadir backdir') 32 sys.exit() 33 source_files = compareme(dir1,dir2) #对比源目录与备份目录 34 dir1 = os.path.abspath(dir1) #取绝对路径后,后面不会自动加上'/' 35 36 if not dir2.endswith('/'): 37 dir2 = dir2+'/' #备份目录路径加'/' 38 39 dir2 = os.path.abspath(dir2) 40 destination_files = [] 41 createdir_bool = False 42 43 for item in source_files: #遍历返回的差异文件或目录清单 44 destination_dir = re.sub(dir1,dir2,item) #将源目录差异路径清单对应替换成备份目录,即需要在dir2中创建的差异目录和文件 45 destination_files.append(destination_dir) 46 if os.path.isdir(item): #如果差异路径为目录且不存在,则在备份目录中创建 47 if not os.path.exists(destination_dir): 48 os.makedirs(destination_dir) 49 createdir_bool = True #再次调用copareme函数标记 50 if createdir_bool : #重新调用compareme函数,重新遍历新创建目录的内容 51 destination_files = [] 52 source_files = [] 53 source_files = compareme(dir1,dir2) #调用compareme函数 54 for item in source_files: #获取源目录差异路径清单,对应替换成备份目录 55 destination_dir = re.sub(dir1,dir2,item) 56 destination_files.append(destination_dir) 57 58 print('update item:') 59 print(source_files) #输出更新项列表清单 60 copy_pair = zip(source_files,destination_files) #将源目录与备份目录文件清单拆分成元组 61 for item in copy_pair: 62 if os.path.isfile(item[0]): #判断是否为文件,是则进行复制操作 63 shutil.copyfile(item[0],item[1]) 64 65 if __name__ == '__main__' : 66 main()
我们只需要努力,然后剩下的交给时间。