运维之公共环境问题排查

1、磁盘空间问题
df -h  查看剩余空间
查看当前目录以及子目录下的磁盘占用
du -sh ./* | sort -nr
当前的文件夹下的磁盘使用
du --max-depth=1 -h

一般为tomcat logs 和linux logs目录
日常linux 删除命令 使用:
rm 命令(删除文件)
shred 命令(安全删除文件)
wipe 命令(安全擦除文件)
secure-deletion 工具包(一个安全文件删除工具集合)
但是 删除超大的文件/文件夹,比如大概 100-200GB,在删除文件(I/O 调度)所花费的时间以及 RAM 占用量

  • 方法一
    [https://www.linuxprobe.com/linux-del-files.html](删除大文件时拖慢系统的技术,合理地占用 I/O。我们可以用 ionice 命令实现)
  • 方法二
    https://linux.cn/article-8024-1.html
    1. 通过重定向到 Null 来清空文件内容
    2. 使用 ‘true’ 命令重定向来清空文件
    3. 使用 cat/cp/dd 实用工具及 /dev/null 设备来清空文件
    4. 使用 echo 命令清空文件
      5.使用 truncate 命令来清空文件内容
  • 方法三
    一般加入linuxcrontab 定时执行
    2、内存问题
    free -m
    一般为 新加服务器 内存配置过大 
    可参照 [https://www.iteye.com/blog/unixboy-174173](JVM调优总结 -Xms -Xmx -Xmn -Xss) 
    ** 3、进程消失问题**
    命令查看进程挂了,或者被人误杀
    ps -ef|grep xx 加上|grep -v grep 可以去掉自身
    查看端口被哪个进程占用
    lsof -i:端口号
    netstat -tunlp|grep 端口号
    netstat -anp |grep 端口号 
    4、公共组件状态异常
    参照 https://blog.csdn.net/syx_1990/article/details/108293170
    5、证书问题
    http://blog.csdn.net/Nazir2513/article/details/50015543
    6、redis无故死掉问题
    开启logfile 发现是内存不足  后发现遗留mysql程序 占用NG内存 删除掉之后相安无事  后续redis单独迁移
posted @ 2021-07-08 12:02  悠然采  阅读(61)  评论(0编辑  收藏  举报