一个非侵入式跟踪分析程序
otel-profiling-agent为elastic开源项目,用于对生产环境中的应用程序进行性能分析,帮助开发者理解程序的运行情况,识别瓶颈,优化性能。用于包括CPU和内存使用情况的分析、调用跟踪、性能指标收集等功能。它是一个用于Linux的全系统、跨语言的性能分析器,通过eBPF(Extended Berkeley Packet Filter)实现,eBPF 起初是为了网络数据包过滤而设计的,但其功能已经大幅扩展,现在它可以用于各种内核子系统,包括但不限于网络、安全、性能监控、系统跟踪和诊断等。
根据官方描述其有如下特点:
1、CPU和内存占用极低(测试中上限为1% CPU和250MB内存)。
2、支持原生C/C++程序,无需DWARF调试信息。
3、支持无框架指针和无主机调试符号的系统库分析。
4、支持混合堆栈跟踪,从内核空间到高级语言。
5、支持多种语言的原生代码分析,无需主机上的调试符号。
6、支持广泛的高级语言(HLLs),如JVM、Python、Ruby、PHP、Node.js、V8、Perl等,.NET正在准备中。
7、100%非侵入性,无需在被分析的进程中加载代理或库。
不需要重新配置、仪器化或重启HLL解释器和VM,代理支持在默认配置中展开每种支持的语言。
8、支持原生inline frames,提供编译器优化的洞察并提供更高精确度的函数调用链。
现有实现
有了它在对Java程序进行性能分析时就可以在极低的性能损失下进行,目前的Java程序性能分析/跟踪实现都是基于Java Agent方案实现的。基于Java Agent是在对的程序侵入性下进行的,侵入性意味着对程序可能会照成比较大影响代码逻辑、性能、系统资源等,还可能因为该程序的漏洞导致生产程序出现安全性问题。
在基于Java Agent的方案下分析/跟踪Java程序的性能损失极端情况下可能达到10%或导致程序崩溃,这对生产环境下的程序影响比较大。
而otel-profiling-agent可以在极低资源占用下实现对Java程序进行非侵入式的跟踪分析。
使用
官方并没有提供编译好的otel-profiling-agent文件,如想尝试可自己编译该项目生成二进制文件。除了源码编译外官方还提供了基于Docker镜像的编译文件,可使用Docker编译减少编译环境导致的问题。
编译完成后可运行如下指令:
sudo ./otel-profiling-agent -collection-agent=127.0.0.1:11000 -disable-tls
注意,运行上面指令需要先开启一个采集器代理用于接收otel-profiling-agent上报的监控数据,如没有启动代理该程序无法启动。官方提供了devfiler桌面应用程序用于通过火焰图可视化采集数据。
collection-agent所接收的数据
devfiler可视化
启动程序即可通过采集器观察到otel-profiling-agent所上报的数据。otel-profiling-agent为一个gRPC客户端程序,采集器为一个gRPC服务端程序。
由于otel-profiling-agent刚开源,目前相关周边生态支持还不够完善,官方提供了一个devfiler桌面应用程序,用于本地可视化代理输出的工具。opentelemetry-collector对otel-profiling-agent也还没有支持。目前官方正在筹备将其捐赠给OpenTelemetry基金会。