linux 通过md5查找重复文件
代码如下:
md5sum *|sort |uniq -w32 -D|awk -F ' ' '{print $2}'
uniq 部分参数 -c #在每行前显示该行重复次数。 -d #只输出重复的行。 -D #只输出重复的行,有几行输出几行。 -f #-f 忽略的段数,-f 1 忽略第一段。 -i #不区分大小写。 -w #忽略第n个字符以后的内容 。 -s #-s 5忽略后面5个字符
md5sum * 先查看所有文件的md5值,重复的文件的md5值相同。
uniq 处理时是处理相邻两行,所以需要先排序。
因为处理完后会显示md5值影响观看,可以通过 awk 命令显示文件名
awk -F ' ' '{print $2}' #-F指定分隔符,{print $2}指定第几列