Linux服务器问题排查思路及常用命令
内存问题
free命令用于查看内存的使用情况,在Linux上,很多人会用top显示系统内存,但是不够直观,top通常我们用于查看CPU的占用率。Linux下查看内容的专用工具是free命令。
各项指标的意义如下:
- total:总表示物理内存的大小;
- used:已使用的内存大小;
- free:可用内存大小;
- shared:多个进程共享的内存总额;
- buff/cached:磁盘缓存的大小;
- available:应用程序能使用的物理内存大小。
free与available的区别
free是真实未被使用的物理内存大小,而available是应用程序可用内存大小
available ≈ free + buffer + cache
CPU问题
除了用top命令,我们还可以使用更为直观的pidstat命令
一般我们关注PID和%CPU两项指标即可。
磁盘IO异常问题
iotop命令可以用于查看正在写磁盘的进程ID信息,它可以帮助我们找到导致磁盘IO异常的进程。
如果各项指标都很低,那么则可能是系统磁盘问题,可以用dmesg命令查看系统信息:
如果是磁盘写满了,按照以下思路找到对应的文件并删除
- 找出最大的五个目录
du -hm / --max-depth=1 | sort -nr | head -5
- 找出当前目录下大于1G的文件
find . -type f -size +1000M
- 假如找到nginx日志access.log,那么我们可能得清空对应的日志文件
echo "">access.log.log
很多人的第一反应是用rm命令
rm -rf access.log
虽然rm可以删除文件,但是有时空间不会被立即释放,比如该例子,nginx服务仍在运行,除非重启该服务。
查看压缩好的备份日志
bzgrep ‘192.168.1.100’ access-2020-04-06.log
为什么要用bzgrep,因为如果解压后再查看会耗费很长的时间。
查看网站并发连接数
比如查看Nginx的并发连接情况,以便我们了解网站的负载情况。
执行以下命令:
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
结果:
ESTABLISHED的数量就是当前并发连接数。
访问量统计
很多时候网站会遭遇恶意攻击,我们需要找到出问题的IP进行封杀。
查询访问最频繁的IP
awk '{print $1}' access-2020-04-06.log | sort | uniq -c | sort -n -k 1 -r | more
其他需求
如根据访问IP统计UV
awk '{print $1}' access-2020-04-06.log | sort | uniq -c | wc -l