文件对比是否一致,我们一般采用md5值对比,假如一样,代表文件一致,不一样说明不一致
假如想要详细的对比信息内容,difflib库提供了文件对比的详细信息和结果
1、首先我们查看下md5值的使用方法
我们先建立几个示例文件方便我们参考,文件file1,file1_copy,file2
2、file1的内容和file1_copy的内容一致,都为
我是文件hello
为了测试我们的文件一致性
3、file2的内容和file1的文件有所区别,内容为:
我是文件world
4、接下来就是获取md5的方法,我可以了个公共方法,大家直接调用就好
需要导入包
import os
import hashlib
def get_file_md5(filename):
if not os.path.isfile(filename):
return
md5 = hashlib.md5()
f = file(filename,'rb')
while True:
b = f.read(8096)
if not b:
break
md5.update(b)
f.close()
return md5.hexdigest()
然后我们打印下这几个文件的md5值
print 'file1 的md5:%s' % get_file_md5('file1.txt')
print 'file1_copy的md5:%s' % get_file_md5('file1_copy.txt')
print 'file2 的md5:%s' % get_file_md5('file2.txt')
5、运行python结果可以看到,file1和file1_copy文件的md5值是一样的,说明这两个文件是一样的,file2和他们不一样
6、接下来就是使用difflib详细的对比了,写法如下:
import difflib
import sys
file1 = open('file1.txt', 'U').readlines()
file2 = open('file2.txt', 'U').readlines()
diff = difflib.ndiff(file1, file2)
sys.stdout.writelines(diff)
7、运行python结果可以看到,具体两个文件的区别
我是文件
- hello+ world
总结:以上就是本次关于python怎样进行文件对比的操作方法,感谢大家的阅读和对呐喊教程的支持。