运维之公共环境问题排查
1、磁盘空间问题
df -h 查看剩余空间
查看当前目录以及子目录下的磁盘占用
du -sh ./* | sort -nr
当前的文件夹下的磁盘使用
du --max-depth=1 -h
一般为tomcat logs 和linux logs目录
日常linux 删除命令 使用:
rm 命令(删除文件)
shred 命令(安全删除文件)
wipe 命令(安全擦除文件)
secure-deletion 工具包(一个安全文件删除工具集合)
但是 删除超大的文件/文件夹,比如大概 100-200GB,在删除文件(I/O 调度)所花费的时间以及 RAM 占用量
- 方法一
[https://www.linuxprobe.com/linux-del-files.html](删除大文件时拖慢系统的技术,合理地占用 I/O。我们可以用 ionice 命令实现) - 方法二
https://linux.cn/article-8024-1.html- 通过重定向到 Null 来清空文件内容
- 使用 ‘true’ 命令重定向来清空文件
- 使用 cat/cp/dd 实用工具及 /dev/null 设备来清空文件
- 使用 echo 命令清空文件
5.使用 truncate 命令来清空文件内容
- 方法三
一般加入linuxcrontab 定时执行
2、内存问题
free -m
一般为 新加服务器 内存配置过大
可参照 [https://www.iteye.com/blog/unixboy-174173](JVM调优总结 -Xms -Xmx -Xmn -Xss)
** 3、进程消失问题**
命令查看进程挂了,或者被人误杀
ps -ef|grep xx 加上|grep -v grep 可以去掉自身
查看端口被哪个进程占用
lsof -i:端口号
netstat -tunlp|grep 端口号
netstat -anp |grep 端口号
4、公共组件状态异常
参照 https://blog.csdn.net/syx_1990/article/details/108293170
5、证书问题
http://blog.csdn.net/Nazir2513/article/details/50015543
6、redis无故死掉问题
开启logfile 发现是内存不足 后发现遗留mysql程序 占用NG内存 删除掉之后相安无事 后续redis单独迁移