Linux下的CPU性能瓶颈分析案例

问题描述:

在对notify执行性能测试时发现cpu负载突然飙高,cpu利用率高达95%。这时候就要排查是哪些线程消耗了cpu,并从代码层找到占用cpu的“罪魁祸首”。

 

步骤:

1. 先用ps+grep找到被测试的进程pid。

比如:ps –ef|grep notify,得到pid为29128。

 

2. 执行top -H -p,可显示出该进程下的所有线程。找到占用cpu最多的子线程pid,并将其转换为16进制。

比如:top -H -p 29128,看到notify的所有子线程。其中,%CPU 比重最大的子线程pid为879,转换成16进制是36f。

 

3. 执行jstack|less,查找子线程pid就能看到堆栈信息了。

比如:jstack 29128|less,再查找nid=0x36f,看到堆栈如下

 

"dispatcherTPConfig-6-thread-22" prio=10 tid=0x000000004dd84000 nid=0x36f runnable [0x000000004ae18000]

java.lang.Thread.State: RUNNABLE

at java.util.ArrayList.contains(ArrayList.java:199)

<notify相关堆栈信息隐藏< span="">>

……

 

 

4. 跟进堆栈中的方法信息定位到代码,接下来就是分析调优了。

 

后记:

用此方法可以简单、快速定位cpu消耗的原因,但是准确度不够理想。如果想深入查看消耗cpu top10的方法,可以使用专门的性能分析工具,例如oprofile、perf都可以实现。

posted on 2015-08-30 22:43  blogsheng  阅读(1617)  评论(0编辑  收藏  举报