C++性能分析工具gperftools

最近编写的程序遇到了性能瓶颈，CPU吃满的情况下消费能力上不去，导致消息积压迟迟得不到消费，最终被kafka丢弃
于是开始对程序进行调优，提高消费能力，便找到这个工具，找到程序中使用CPU时间较多的操作，并对这些操作进行调整，反复测试和调整，不断迭代得到高性能的程序

这里只使用了gperftools里的cpuprofiler，谷歌这套工具里面也有堆栈的分析工具，那些下次有用到在做分享吧

编译安装

到github/gperftools上获取源码

wget https://github.com/gperftools/gperftools/archive/gperftools-2.7.tar.gz
tar xvf gperftools-2.7.tar.gz
cd gperftools-2.7
./configure
make -j8
sudo make install

如果是64位系统需要依赖到libunwind

cd libunwind-1.3.1
./configure
make && sudo make install

使用CPUprofiler

官方说明

在编译的时候连接profiler

gcc [...] -0 proc -lprofiler

使用cmake的情况

target_link_libraries (
    ...
    "profiler"
)

主动结束的程序

在代码中引入gperftools/profiler.h，使用ProfilerStart()和ProfilerStop()函数

#include <gperftools/profiler.h>
int main(int argc, const char* argv[]) {
    ProfilerStart("test.prof");
    ...;
    ProfilerStop();
}

在执行ProfilerStop()的时候就生成测试报告test.prof了

持续运行的程序

对于持续运行的程序，例如服务器程序和反复的消费程序，内部是死循环无法主动退出的情况下，可以通过设置开关来控制程序生成测试报告

#include <gperftools/profiler.h>
#include <signal.h>
#include <iostream>
void setGperfStatus(int signum) {
    static bool is_open = false;
    if (signum != SIGUSR1) {
        return ;
    }
    if (!is_open) {  // start
        is_open = true;
        ProfilerStart("test.prof");
        std::cout << "ProfilerStart success" << std::endl;
    } else {  // stop
        is_open = false;
        ProfilerStop();
        std::cout << "ProfilrerStop success" << std::endl;
    }
}
int main(int argc, const char* argv[]) {
    signal(SIGUSR1, setGperfStatus);
    ...;
}

在程序运行后，通过kill指令发送信号控制开启关闭性能分析模块

kill -s SIGUSR1 $PID

开启性能测试后运行一段时间，等待采集到的足够多的样例之后，再次发送信号关闭性能分析，生成测试报告

测试报告

性能分析通过抽样方法完成，默认是1秒100个样本，一个样本是10毫秒，即时间单位是10毫秒
可以通过环境变量CPUPROFILE_FREQUENCY设置采样频率

使用gperftools提供的pprof工具转换.prof文件为可阅读的形式，支持多种形式

文本形式

pprof proc test.prof --text > test.txt

信息

每行包含6列数据，依次为:

分析样本数量（不包含其他函数调用）
分析样本百分比（不包含其他函数调用）
目前为止的分析样本百分比（不包含其他函数调用）
分析样本数量（包含其他函数调用）
分析样本百分比（包含其他函数调用）
函数名

样本数量相当于消耗的CPU时间
整个函数消耗的CPU时间相当于包括函数内部其他函数调用所消耗的CPU时间

树形图

pprof proc test.prof --web > test.html
pprof proc test.prof --pdf > test.pdf

节点

每个节点列出的信息：

函数名或者类名+函数名
不包含内部函数调用的样本数（百分比）
包含内部函数调用的样本数（百分比），如果没有内部调用函数则这一项数据不显示

有向边

调用者指向被调用者，有向边上的时间表示被调用者所消耗的CPU时间

过滤

可以通过设置focus或者ignore来集中显示、过滤某个函数

pprof proc test.prof --gv --focus=vsnprintf  # 只关注某个函数
pprof proc test.prof --gv --ignore=snprintf  # 过滤掉某个函数


转☞ https://www.jianshu.com/p/bf2f8a5a81d0

posted @ 2022-12-29 09:38 Oontinue 阅读(865) 评论(0) 收藏举报

刷新页面返回顶部

Oontinue