Fastdfs文件系统删除重复的文件

环境:centos、fastdfs

Fastdfs文件系统删除重复的文件

问题:fastdfs文件系统磁盘空间疯狂扩展。

原因:fastdfs产生了很多的文件备份,要找到重复文件,排除在使用的文件删除其他的文件。

根源可能是程序反复上传原因,开发进行跟中

 

删除不需要文件思路:

1、查看文件重复情况

2、列出所有文件系统文件,和从数据库找到所有在用的文件名称

3、处理fastdfs导出的所有的文件路径名称 和 数据库导出名称格式一样

4、比对fastdfs和数据库的名称,找出没有在数据库中的文件名称

5、根据比对结果找到fastdfs的文件路径,进行删除

 

 

1、找到所有文件,并通过md5查看重复情况

find /data/fdfs_storage/data -type f -name “*.jpg” > /tmp/all.txt   #找出所有文件
for i in `cat /tmp/all.txt`;do md5sum $i >> /tmp/all_md5.txt;done    #查出文件的md5值
uniq -c /tmp/all_md5.txt|sort -n -r                                 #去重查看重复文件数

 

2、fastdfs 文件名称/tmp/all.txt ,数据库文件名称 /tmp/sjk.txt

cat /tmp/all.txt|awk -F / ‘{print $7}’ >> /tmp/all_fastdfs.txt               #处理fastdfs文件和数据库文件一样
sort /tmp/all_fastdfs.txt >> /tmp/all_fastdfs_new.txt                        #对fastdfs文件进行排序
sort /tmp/sjk.txt >> /tmp/sjk_new.txt                                        #对数据库文件进行排序
comm /tmp/all_fastdfs_new.txt /tmp/sjk_new.txt -2 -3 >> /tmp/fastdfs-sjk.txt #fastdfs文件排除数据库的文件,这些文件是要删除的文件

 

3、找出这些文件并删除

for i in `/tmp/fastdfs-sjk.txt`;do grep $i  /tmp/all.txt > /tmp/delete-fasts.txt;done #找出文件路径
for i in ` /tmp/delete-fasts.txt`;do rm -rvf $i;done                                  #删除文件

4、常用命令

uniq [ -c | -d | -u ] [ -f Fields ] [ -s Characters ] [ -Fields ] [ +Characters ] [ InFile [ OutFile ] ]
   -c 在输出行前面加上每行在输入文件中出现的次数。
  -d 仅显示重复行。
  -f  忽略由 Fields 变量指定的字段数目。如果 Fields 变量的值超过输入行中的字段数目, uniq 命令用空字符串进行比较。这个标志和 -Fields 标志是等价的。
  -u 仅显示不重复的行。
例子:查询一个文件重复最多的前10条记录:

   uniq -c file | sort -n -r |head -10

comm命令语法:comm [-123] [--help][--version][file1][file2]

comm命令参数:
  -1   不显示只在第1个文件里出现过的列。
  -2   不显示只在第2个文件里出现过的列。
  -3   不显示只在第1和第2个文件里出现过的列。

FastDFS常见命令
 
1: 启动FastDFS
          tracker: /usr/local/bin/fdfs_trackerd /etc/fdfs/tracker.conf
          storage: /usr/local/bin/fdfs_storaged /etc/fdfs/storage.conf
2:关闭FastDFS
          tracker:/usr/local/bin/stop.sh /usr/local/bin/fdfs_tracker
          storage:/usr/local/bin/stop.sh /usr/local/bin/fdfs_storage
        或者 killall fdfs_trackered(storaged)  -------注意,千万不要使用-9强行杀死进程。
3:重启FastDFS
          tracker:/usr/local/bin/restart.sh /usr/local/bin/fdfs_trackered
          storage:/usr/local/bin/restart.sh /usr/local/bin/fdfs_storaged
4:查看集群情况
          在任意一台storage(tracker也可以) /usr/local/bin/fdfs_monitor /etc/fdfs/storage.conf
5:删除一个storage:
           在任意一台storage(tracker也可以) /usr/local/bin/fdfs_monitor /etc/fdfs/storage.conf delete group2 20.12.1.73
6:上传文件
          /usr/bin/fdfs_upload_file /etc/fdfs/client.conf /opt/02.jpg
7:删除上传的文件
         /usr/local/bin/fdfs_delete_file   配置文件   需要删除的文件路径
        /usr/local/bin/fdfs_delete_file  /etc/fdfs/client.conf  group3/M00/00/00/wKgAUE5yiVK0VEpSACiWWseqpak.tar.gz
posted @ 2020-08-05 17:34  苍茫宇宙  阅读(1715)  评论(0编辑  收藏  举报