简单用vtune分析热点

vtune需要运行在intel处理器的电脑上,在AMD上好像只能使用callgraph。

调试时需要有源代码或者相应的PDB文件:

pdb生成办法:打开/Zi /debug生产pdb文件,PBD只需和运行程序放在同一目录即可。

分析完后,默认是按照CPU_CLK_UNHALTED排序的。

需要关注的内容:

Event based sampling :测程序执行中处理器的内部事件(Performance Monitor Unit:PMU)发生次数(及样本)。

Sample After Value (SAV):当事件达到一定的累积,去获得一个样本. SAV就是一个事件的设定值.如,CPU得主频是2G Hz, 每秒得到1000个样本,SAV=2,000,000,000/1000 = 2,000,000

INST_RETIRED.ANY : 表示指令的有效执行的计数

CPU_CLK_UNHALTED.CORE: 表示非停机状态花费的机器周期

CPI = CPU_CLK_UNHALTED.CORE / INST_RETIRE.ANY, 表示一段代码(函数,模块)平均每条指令花费的机器周期.自然是愈小愈好.

——CPU_CLK_UNHALTED.CORE大的函数,且CPI也大的函数,去关注(通常称之为热点函数).


posted @ 2011-05-08 23:24  阿亮同学  阅读(967)  评论(0编辑  收藏  举报