Linux系统下rm删除文件后空间没有释放问题解决办法
一、问题描述
今日收到zabbix监控报警,发现生产环境一台服务器的磁盘空间不足,需要进行处理,登录后发现可利用率不足20%,进行相关查看和处理工作;但是操作删除了一些备份文件和日志信息后,查看空间仍然不足。
二、具体操作过程
1、检查服务器占用硬盘资源的文件
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | [root@ nc -ftp02 ~] # df -hP Filesystem Size Used Avail Use% Mounted on /dev/xvda2 99G 4.2G 90G 5% / tmpfs 3.9G 228K 3.9G 1% /dev/shm /dev/xvda1 380M 66M 294M 19% /boot /dev/xvda5 386G 290G 77G 80% /data [root@ nc -ftp02 ~] # cd /data/ [root@ nc -ftp02 data] # ls backup data_bak ftp lost+found script [root@ nc -ftp02 data] # du -sh * 4.1G backup 12G data_bak 813M ftp 16K lost+found 5.0G nchome 16K script |
注意:查看后,发现data目录下,并无大文件存在,备份目录下面只保留了2个月的数据,所以问题依旧存在。
这时想起来,在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的文件夹结构上解除链接(unlink).然而假设文件是被打开的(有一个进程正在使用),那么进程将仍然能够读取该文件,磁盘空间也一直被占用。而我删除的是备份和log文件删除的时候文件应该正在被使用;
2、查看删除文件被占用的具体情况
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | [root@ nc -ftp02 data] # lsof -n /data |grep deleted sh 8757 root 1w REG 202,5 287246420690 12 /data/nohup .out (deleted) sh 8757 root 2w REG 202,5 287246420690 12 /data/nohup .out (deleted) rsync 28485 root 1w REG 202,5 287246420690 12 /data/nohup .out (deleted) rsync 28485 root 2w REG 202,5 287246420690 12 /data/nohup .out (deleted) ssh 28486 root 2w REG 202,5 287246420690 12 /data/nohup .out (deleted) ssh 28486 root 6w REG 202,5 287246420690 12 /data/nohup .out (deleted) [root@ nc -ftp02 data] # lsof -n /data |grep deleted|awk '{print $2}' 8757 8757 28674 28674 28675 28675 [root@ nc -ftp02 data] # lsof -n /data |grep deleted|awk '{print $2}'|xargs kill -9 [root@ nc -ftp02 data] # lsof -n /data |grep deleted [root@ nc -ftp02 data] # df -h Filesystem Size Used Avail Use% Mounted on /dev/xvda2 99G 4.2G 90G 5% / tmpfs 3.9G 228K 3.9G 1% /dev/shm /dev/xvda1 380M 66M 294M 19% /boot /dev/xvda5 386G 22G 345G 6% /data |
3、如何让进程释放?
一种方法是kill掉相应的进程,另一种就是停掉使用这个文件的应用,让os自己主动回收磁盘空间。
3.1、如果系统管理员能够熟悉该服务器上相关应用部署和配置,可以通过第一种方法进行释放,我在操作过程,采用的就是kill掉应用中不使用的进程来释放空间;
当linux打开一个文件的时候,Linux内核会为每个进程在/proc/ 『/proc/nnnn/fd/文件夹(nnnn为pid)』建立一个以其pid
为名的文件夹用来保存进程的相关信息,而其子文件夹fd保存的是该进程打开的全部文件的fd(fd:file descriptor)。
kill进程是通过截断proc文件系统中的文件能够强制要求系统回收分配给正在使用的的文件。
仅到管理员确定不会对执行中的进程造成影响时使用。应用程序对这样的方
式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题
3.2、如果环境有非常多进程在使用的这个文件,停掉进程可能带来一定风险,又不在系统管理员控制范围内,建议不要轻易使用kill进行操作;最好原则合适时间停掉相关应用进行释放。
综上所述,问题解决!
---------------------------------------------书山有路勤为径,学海无涯苦作舟--------------------------------------------------------
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步