CPU 100%问题排查总结

更多内容,移步IT-BLOG

排查思路


【1】定位高负载进程 pid:登录进服务器使用 top 或 top -c命令[ps -ef | grep xxx 命令]查看当前 CPU消耗过高的进程,从而得到进程id。观察各个进程资源使用情况,可以看出进程id为18571的进程,有着较高的CPU占比。按P(大写)可以倒序查看占CPU占用率。

定位具体的异常业务使用 pwdx pid 命令[查看当前 pid进程启动时的工作目录]根据 pid 找到业务进程路径,进而定位到负责人和项目。

【2】根据 Pid查出消耗 cpu最高的线程号:top -Hp  18571,按下P,进程按照 Cpu使用率排序。找出最耗 Cpu的线程,结果发现18584是就耗了99.9%。一般超过80%就是比较高的,80%左右是合理情况。这样我们就能得到CPU消耗比较高的线程id。

将十进制转化为十六进制:printf "0x%x\n" 18584

【3】根据线程号查出对应的 java线程:jstack 18571| vim +/0x4898 - 查看线程的堆栈信息。也可以通过 jstack -l 18571 > ./18571.stack 将线程的信息导出到 18571.statck 文件。然后执行,grep命令,看线程0x4898 做了什么 。cat 18571.stack | grep '0x4898' -C 8 查看文件中线程的堆栈信息。这里我们就可以区分导致 CPU过高的原因具体是 Full GC次数过多还是代码中有比较耗时的计算了。如果是Full GC次数过多,那么通过 jstack得到的线程信息会是类似于VM Thread之类的线程,而如果是代码中有比较耗时的计算,那么我们得到的就是一个线程的具体堆栈信息[如下]。

posted @ 2020-11-18 17:45  Java程序员进阶  阅读(309)  评论(0编辑  收藏  举报