python-----利用filecmp删除重复文件

以下代码素材自取:链接:https://pan.baidu.com/s/1fL17RjKyGjpvpeeUFONCaQ  提取码:zgiw

# coding:utf-8
import os
import filecmp

# 将指定目录下的所有文件的路径存储到all_files变量中
def get_all_files(path, dirs):
    all_files = []
    for d in dirs:
        cur_path = os.path.join(path, d)
        files = os.listdir(cur_path)
        for f in files:
            all_files.append(os.path.join(cur_path, f))
    return all_files

# 比较两个文件的内容是否一致
def cmp_files(x, y):
    if filecmp.cmp(x, y):
        # 如果一致,则删除第二个,保留第一个,并输出信息
        os.remove(y)
        print("路径\"" + y + "\"下的文件是重复文件,已经删除")

if __name__ == '__main__':
    # 需要把路径替换成你的文件夹所在路径,当把这个代码文件放在要处理的文件夹外一层时,可以使用下面的相对路径写法
    path = r'F:\temp\problem3_files'
    # 已知路径下存在两个文件夹pic1和pic2
    dirs = ['pic1', 'pic2']
    # 调用函数,获取文件列表
    all_files = get_all_files(path, dirs)
    # 用双重for循环来比较文件是否有重复
    for x in all_files:
        for y in all_files:
            # 如果x和y不是相同的文件,而且都存在,则执行后续操作
            if x != y and os.path.exists(x) and os.path.exists(y):
                # 比较两个文件的内容是否一致
               cmp_files(x,y)

 

posted @ 2019-01-23 16:38  小呆丶  阅读(976)  评论(0编辑  收藏  举报