CPU 100%问题排查总结
更多内容,移步IT-BLOG
排查思路
【1】定位高负载进程 pid:登录进服务器使用 top 或 top -c命令[ps -ef | grep xxx 命令]查看当前 CPU消耗过高的进程,从而得到进程id。观察各个进程资源使用情况,可以看出进程id为18571的进程,有着较高的CPU占比。按P(大写)可以倒序查看占CPU占用率。
【2】根据 Pid查出消耗 cpu最高的线程号:top -Hp 18571,按下P,进程按照 Cpu使用率排序。找出最耗 Cpu的线程,结果发现18584是就耗了99.9%。一般超过80%就是比较高的,80%左右是合理情况。这样我们就能得到CPU消耗比较高的线程id。
【3】根据线程号查出对应的 java线程:jstack 18571| vim +/0x4898 - 查看线程的堆栈信息。也可以通过 jstack -l 18571 > ./18571.stack 将线程的信息导出到 18571.statck 文件。然后执行,grep命令,看线程0x4898
做了什么 。cat 18571.stack | grep '0x4898' -C 8 查看文件中线程的堆栈信息。这里我们就可以区分导致 CPU过高的原因具体是 Full GC次数过多还是代码中有比较耗时的计算了。如果是Full GC次数过多,那么通过
jstack得到的线程信息会是类似于VM Thread之类的线程,而如果是代码中有比较耗时的计算,那么我们得到的就是一个线程的具体堆栈信息[如下]。