Android性能分析工具systrace使用
Android性能分析工具systrace的使用,能根据需要抓取trace。
了解trace文件中数据的含义,能分析简单的性能问题。
1、systrace简介
systrace是Android4.1版本之后推出的,对系统Performance分析的工具。
systrace的功能包括跟踪系统的I/O操作、内核工作队列、CPU负载以及Android各个子系统的运行状况等。在Android平台中,它主要由3部分组成:
-
内核部分:Systrace利用了Linux Kernel中的
ftrace
功能。所以,如果要使用systrace的话,必须开启kernel中和ftrace相关的模块。 -
数据采集部分:Android定义了一个Trace类。应用程序可利用该类把统计信息输出给ftrace。同时,Android还有一个
atrace
程序,它可以从ftrace中读取统计信息然后交给数据分析工具来处理。 -
数据分析工具:Android提供一个
systrace.py
(python脚本文件,位于Android SDK目录/sdk/platform-tools/systrace
中,其内部将调用atrace程序)用来配置数据采集的方式(如采集数据的标签、输出文件名等)和收集ftrace统计数据并生成一个结果网页文件供用户查看。
简单来说,当机器以60帧/秒显示(也就是16.6 ms),用户会感觉机器会流畅。如果出现显示时出现丢帧的情况,就需要知道系统在做什么?
Systrace 是用来收集系统和应用的数据信息和一些中间生成数据的细节,在Android 4.1系统和4.1之后的系统。
Systrace在一些分析显示的问题上特别有用,如应用画图慢,显示动作或动画时变形。
2、抓取systrace
进入Android/Sdk/platform-tools/systrace目录下
python systrace.py -b 8000 -t 5 -o systrace.html
Google
Chrome浏览器可以打开systrace,如果打不开,可以浏览器输入chrome://tracing/
,然后load
systrace。
(1)脚本命令的option
options |
描述 |
---|---|
-o < FILE > |
输出的目标文件 |
-t N, –time=N |
执行时间,默认5s |
-b N, –buf-size=N |
buffer大小(单位kB),用于限制trace总大小,默认无上限 |
-k < KFUNCS >,–ktrace=< KFUNCS > |
追踪kernel函数,用逗号分隔 |
-a < APP_NAME >,–app=< APP_NAME > |
追踪应用包名,用逗号分隔 |
–from-file=< FROM_FILE > |
从文件中创建互动的systrace |
-e < DEVICE_SERIAL >,–serial=< DEVICE_SERIAL > |
指定设备 |
-l, –list-categories |
列举可用的tags |
(2) 在app添加自己的systrace log
说明1:-o trace输出的文件路径
说明2:--time 配置抓取systrace的时间,通常设置5秒,并在5秒内重现问题,时间太短会导致问题重现时没有被抓到,时间太长会导致JavaHeap不够而无法保存,因此在能抓到问题点的情况下,时间越小越好。
说明3:--buf-size Buffer Size是存储systrace的size,同样的,太小会导致信息丢失,时间太长会导致Java Heap不够而无法保存,建议20480。
说明4:如果用户有自己在应用程序中加入自己的systrace log,如下:
Trace.beginSection("newInstance");
Trace.endSection("newInstance");
那么此处必须选择这个应用对应的进程名字,否则新加的systrace log不会被抓到。
在一些方法里加入trace 方便自己 跟踪调试 , 如下:
Trace.traceBegin("performTraversals");
try {
……
} finally {
Trace.traceEnd();
}
需要保证 traceBegin 与 traceEnd 一定要成对出现。 并且一定要在同一个线程里面。
加入trace的好处在于,生成的trace文件中,会在跟踪的代码段执行对应时间轴区间打上一个tag标记(比如上例中的performTraversals)
如果在代码中加入了trace,在生成trace文件时,必须指定进程为trace所在的进程。
3、systrace.html分析
3.1 trace图结构
3.1.1、颜色释义
在进程的上面有一条很细的进度条,包含了该线程的状态:
灰色:
睡眠。
蓝色:
可以运行(它可以运行,但还未被调度运行)。
绿色:
正在运行(调度程序认为它正在运行)。
红色:
不间断的睡眠(通常发生在内核锁上), 指出I
/ O负载,对于性能问题的调试非常有用
橙色:
由于I
/ O负载导致的不间断睡眠。
要查看不间断睡眠的原因(可从sched_blocked_reason跟踪点获取),请选择红色不间断睡眠切片。
------------------------------------------------------------------------------------------------------------------------
同一个进程内按线程进行纵向拆分,每个线程记录自己的工作。分别以包名为标识。每个应用进程都会包含其中所有线程的记录信号,可以看到从InputEvent到RenderThread都有。
除了进程和线程运行信息,还有两个重要信息:
3.1.2、Frame(例:UI Performance)
每个app都有一行专门显示frame,每一帧就显示为圆圈,正常绘制是1秒60帧,大约一帧16.6毫秒,在这个值以下是正常颜色绿色,如果超过它就会变成红色、黄色。非绿色的都说明有问题。这时需要通过’w’键放大那一帧,然后按‘m’键高亮,进一步分析问题。
以分析UI Performance为例:
对于Android
5.0(API level 21)或者更高的设备,该问题主要聚焦在UI
Thread
和Render
Thread
这两个线程当中。对于更早的版本,则所有工作在UI
Thread
。
3.1.3、Alerts
Systrace能自动分析trace中的事件,并能自动高亮性能问题作为一个Alerts,建议调试人员下一步该怎么做。
比如对于丢帧,点击黄色或红色的Frames圆点便会有相关的提示信息;另外,在systrace的最右上方,有一个Alerts tab可以展开,这里记录着所有的的警告提示信息。
3.1.4、使用alert和frame分析
(1)当我们点击了Alerts或者点击右边的Alerts列表中的任何一点我们可以看到在界面的最底部会相对应的优化提示以及可能会出现优化的视频教程链接。
比如上面的提示说你View的draw绘制花的时间太长了,然后我们可以根据Description来很明白的看到提示的内容是什么。
(2)然后我们可以点击一块Frames中的F来查看,同样的它会生成一份跟Alerts类似的报告结果并放在界面的最底端。
(3)可以通过按下m键查看这一帧到下一帧所花费的时间以及哪个方法被调用的最长。看到时间>16.6ms,系统要求UI的60fps水准所以系统会报出黄色的警告。照样我们从Description中可以读出到底是哪里出了问题。
Description
:
-
ListView item recycling involved inflating views. Ensure your Adapter#getView() recycles the incoming View, instead of constructing a new one.
可以看出来系统提示你在getView中花费了太多时间没能很有效的复用机制。我们就能顺着这条路去找界面的代码哪里出现了不足从而优化完善。
(4)Alerts和Frames两栏,它们展示了通过手机来的数据而生成出来的可视化分析结果。选择最上方的alerts:
这个警告指出了,有一个View#draw()方法执行了比较长的时间。可以在下面看到问题的描述,链接,甚至是相关的视频。下面我们看Frames这一行,可以看到这里展示了被绘制出来的每一帧,并且用绿、黄、红三颜色来区分它们在绘制时的性能。
(5)frame一栏(点击右侧Alert type的Scheduling delay):在下方显示栏,我们看到了与这一帧所相关的一些警告。在这三个警告中,有一个是我们上面所提到的(View#draw())。接下来我们在这一帧处放大并在下方展开“Inflation during ListView recycling”这条警告:
可以看到警告部分的总耗时,32毫秒,远高于了我们对保障60fps所需的16毫秒绘制时间。同时还有更多的ListView每个条目的绘制时间,大约是6毫秒每个条目,总共五个。而Description描述项中的内容会帮助我们理解问题,甚至提供问题的解决方案。
(6)可以在“inflate”(某个函数方法)这一个块区处放大,并且观察到底是哪些View在被填充过程中耗时比较严重。
在选择了某一帧之后,按“m”键来高亮这一帧,并且在上方看到了这一部分的耗时,如图,我们看到了这一阵的绘制总共耗时超过19毫秒。而当我们展开这一帧唯一的一个警告时,我们发现了“Scheduling delay”这条错误。
Scheduling delay(调度延迟)的意思就是一个线程在处理一块运算的时候,在很长一段时间都没有被分配到CPU上面做运算,从而导致这个线程在很长一段时间都没有完成工作。我们选择这一帧中最长的一块,从而得到更加详细的信息:
在红框区域内,“Wall duration”,他代表着这一区块的开始到结束的耗时。
CPU Duration一项中显示了实际CPU在处理这一区块所消耗的时间。
很显然,两个时间的差距还是非常大的。整个区块耗时18毫秒,而在这之中CPU只消耗了4毫秒的时间去运算。
这时候应该到最上面看Kernel中CPU在做什么操作。
(7)在这一帧中选择一个CPU,查看运行的进程和线程。
可能会由于另外一个程序占用CPU,导致了我们的程序未能获得足够的CPU资源。
但是这种情况其实是暂时的,因为被其他后台应用占用CPU的情况并不多见,但仍有其他应用的线程或是主线程占用CPU。
3.2、systrace重点分析部分(由上往下)
(1)CPU
(2)在SurfaceFlinger上面有一个SurfaceView显示buffer的数量
(3)VSYNC信号(一帧16.67ms)分为:
VSYNC-app
VSYNC-sf
相互错位,并且SF进行图像混合的时候总是在每帧的最开始。不能超过一帧。
(4)SurfaceFlinger
在每帧的最开始,包含SurfaceFlinger模块调用的各个函数。
主要有:
acquireBuffer从BufferQueue申请buffer
releaseBuffer 释放buffer返回到BufferQueue
PS:如果Buffer数量过多,可能是释放buffern之前调用到display模块的函数停滞过久。
(5)app的绘制
例如对手机camera进行拍照时抓取systrace,绘制的app就是camera。
绘制也是在一帧的开始(VSYNC-app)。
绘制中包含调用的各个函数。
主要有:
dequeueBuffer从BufferQueue申请buffer
queueBuffer返回buffer到BufferQueue
(6)LCD(HWC、display..)
显示模块,在app的下面,一般为UI thread,包含在SF进行图像混合后,将buffer传递到这个模块。
3.2.1、app、sf、显示三者的关系:
在app的一帧中绘制好后,将信息传递到SF;
在VSYNC-sf下一帧开始时,SF进行图像混合;
在SF图像混合后进行LCD显示(可能在SF混合的过程中就已经调用到显示模块的函数,因此时间上可能会有交叉。)
3.2.2、一个持续定期的工作负载的阶段
例如TouchLatency,UI管道,通常包含以下阶段:
-
SurfaceFlinger中的EventThread唤醒了应用程序UI线程,表明现在是渲染新帧的时候了。
-
应用程序使用CPU和GPU资源在UI线程,RenderThread和hwuiTasks中渲染帧。这部分暂UI的大部分。
-
应用程序通过binder将绘制好的帧发送到SurfaceFlinger并进入睡眠状态。
-
SurfaceFlinger中的第二个EventThread唤醒SurfaceFlinger来触发组合和显示输出。如果SurfaceFlinger确定没有任何工作要完成,它将返回睡眠状态。
-
SurfaceFlinger通过HWC / HWC2或GL处理组合。 HWC / HWC2组合更快,更低的功耗,但会受到SOC的限制。这一步通常需要4-6ms,但是可以与步骤2重叠,因为Android应用程序总是三重缓冲。 (虽然应用程序总是三重缓冲,但在SurfaceFlinger中只能有一个待处理帧,因此和双重缓存差不多。)
-
SurfaceFlinger通过供应商驱动程序调度最终输出,并返回睡眠状态,等待EventThread唤醒。
4、systrace操作快捷键
4.1、导航
导航操作 |
作用 |
---|---|
w |
放大,[+shift]速度更快 |
s |
缩小,[+shift]速度更快 |
a |
左移,[+shift]速度更快 |
d |
右移,[+shift]速度更快 |
4.2、快捷操作
常用操作 |
作用 |
---|---|
f |
放大当前选定区域(放大选定的一块) |
m |
标记当前选定区域(可以显示时间长度) |
v |
高亮VSync(所在的一帧) |
g |
切换是否显示60hz的网格线(同上) |
0 |
恢复trace到初始态,这里是数字0而非字母o(缩小到初始) |
一般操作 |
作用 |
---|---|
h |
切换是否显示详情 |
/ |
搜索关键字 |
enter |
显示搜索结果,可通过← →定位搜索结果 |
` |
显示/隐藏脚本控制台 |
? |
显示帮助功能 |
4.3、模式切换(小功能框)
-
Select mode: 双击已选定区能将所有相同的块高亮选中;(对应数字1)
-
Pan mode: 拖动平移视图(对应数字2)
-
Zoom mode:通过上/下拖动鼠标来实现放大/缩小功能;(对应数字3)
-
Timing mode:拖动来创建或移除时间窗口线。(对应数字4)
可通过按数字1~4,用于切换鼠标模式; 另外,按住alt键,再滚动鼠标滚轮能实现放大/缩小功能。