C++性能分析工具gperftools

最近编写的程序遇到了性能瓶颈,CPU吃满的情况下消费能力上不去,导致消息积压迟迟得不到消费,最终被kafka丢弃
于是开始对程序进行调优,提高消费能力,便找到这个工具,找到程序中使用CPU时间较多的操作,并对这些操作进行调整,反复测试和调整,不断迭代得到高性能的程序

这里只使用了gperftools里的cpuprofiler,谷歌这套工具里面也有堆栈的分析工具,那些下次有用到在做分享吧

编译安装

到github/gperftools上获取源码

wget https://github.com/gperftools/gperftools/archive/gperftools-2.7.tar.gz
tar xvf gperftools-2.7.tar.gz
cd gperftools-2.7
./configure
make -j8
sudo make install

如果是64位系统需要依赖到libunwind

cd libunwind-1.3.1
./configure
make && sudo make install

使用CPUprofiler

官方说明

在编译的时候连接profiler

gcc [...] -0 proc -lprofiler

使用cmake的情况

target_link_libraries (
    ...
    "profiler"
)

主动结束的程序

在代码中引入gperftools/profiler.h,使用ProfilerStart()和ProfilerStop()函数

#include <gperftools/profiler.h>
int main(int argc, const char* argv[]) {
    ProfilerStart("test.prof");
    ...;
    ProfilerStop();
}

在执行ProfilerStop()的时候就生成测试报告test.prof了

持续运行的程序

对于持续运行的程序,例如服务器程序和反复的消费程序,内部是死循环无法主动退出的情况下,可以通过设置开关来控制程序生成测试报告

#include <gperftools/profiler.h>
#include <signal.h>
#include <iostream>
void setGperfStatus(int signum) {
    static bool is_open = false;
    if (signum != SIGUSR1) {
        return ;
    }
    if (!is_open) {  // start
        is_open = true;
        ProfilerStart("test.prof");
        std::cout << "ProfilerStart success" << std::endl;
    } else {  // stop
        is_open = false;
        ProfilerStop();
        std::cout << "ProfilrerStop success" << std::endl;
    }
}
int main(int argc, const char* argv[]) {
    signal(SIGUSR1, setGperfStatus);
    ...;
}

在程序运行后,通过kill指令发送信号控制开启关闭性能分析模块

kill -s SIGUSR1 $PID

开启性能测试后运行一段时间,等待采集到的足够多的样例之后,再次发送信号关闭性能分析,生成测试报告

测试报告

性能分析通过抽样方法完成,默认是1秒100个样本,一个样本是10毫秒,即时间单位是10毫秒
可以通过环境变量CPUPROFILE_FREQUENCY设置采样频率

使用gperftools提供的pprof工具转换.prof文件为可阅读的形式,支持多种形式

文本形式

pprof proc test.prof --text > test.txt
信息

每行包含6列数据,依次为:

  1. 分析样本数量(不包含其他函数调用)
  2. 分析样本百分比(不包含其他函数调用)
  3. 目前为止的分析样本百分比(不包含其他函数调用)
  4. 分析样本数量(包含其他函数调用)
  5. 分析样本百分比(包含其他函数调用)
  6. 函数名

样本数量相当于消耗的CPU时间
整个函数消耗的CPU时间相当于包括函数内部其他函数调用所消耗的CPU时间

树形图

pprof proc test.prof --web > test.html
pprof proc test.prof --pdf > test.pdf
节点

每个节点列出的信息:

  1. 函数名 或者 类名+函数名
  2. 不包含内部函数调用的样本数(百分比)
  3. 包含内部函数调用的样本数(百分比),如果没有内部调用函数则这一项数据不显示
有向边

调用者指向被调用者,有向边上的时间表示被调用者所消耗的CPU时间

过滤

可以通过设置focus或者ignore来集中显示、过滤某个函数

pprof proc test.prof --gv --focus=vsnprintf  # 只关注某个函数
pprof proc test.prof --gv --ignore=snprintf  # 过滤掉某个函数


转☞ https://www.jianshu.com/p/bf2f8a5a81d0
posted @ 2022-12-29 09:38  Oontinue  阅读(575)  评论(0编辑  收藏  举报