为什么Linux 实例执行 df 和 du 查看磁盘时结果不一致

 

问题现象

  1. 执行 df -h 查看 ECS Linux 实例文件系统使用率,可以看到 /dev/xvdb1 磁盘占用了约27G,挂载目录为 /opt 。

    df

  2. 进入到 /opt 目录执行 du -sh ,显示空间总占用量约 2.4 G,即df 和du查看到的结果不一致。

    du

原因分析

  • du 命令对统计文件逐个进行 fstat 系统调用,获取文件大小。它的数据是基于文件获取,可以跨多个分区操作。

  • df 命令使用 statfs 系统调用,直接读取分区的超级块信息获取分区使用情况。它的数据基于分区元数据,只能针对整个分区。

  • 用户删除了大量的文件后,du 就不会在文件系统目录中统计这些文件。如果此时还有运行中的进程持有这个已经被删除的文件句柄,那么这个文件就不会真正在磁盘中被删除,分区超级块中的信息也就不会更改,df 仍会统计这个被删除的文件。

  • 通过 lsof 查询处于 deleted 状态的文件,被删除的文件在系统中被标记为 deleted 。如果系统有大量 deleted 状态的文件,会导致 du 和 df 统计结果不一致。

     
    1. #lsof |grep deleted //在opt目录下执行lsof |grep deleted

解决方案

  1. 根据 lsof 列出的 pid,kill 相应进程或者重启相应的服务,如:#kill -9 692

    注意:如果实例正在运行业务进程,kill 会直接终止进程,请慎重操作。

  2. 重启实例。重启实例系统会退出现有的进程,开机后重新加载,过程中会释放调用的 deleted 文件的句柄。

posted @ 2019-05-11 16:09  侃豺小哥  阅读(281)  评论(0编辑  收藏  举报