Pycharm图形化性能测试工具Profile

在部署模型的时候遇到一个需要加速的问题，为了搞清楚模型调用过程中最耗时的操作以定位优化，同事告诉了我一个调优的工具，叫 profile。搜集整理如下：

1. PyCharm图形化性能测试工具Profile

PyCharm提供了图像化的性能分析工具，使用方法见利用PyCharm的Profile工具进行Python性能分析。

另外，结合后面其他测试时间的python包以及pycharm打印出的log信息，可以知道，

运行时使用了cprofile以及其中profiler这两个工具来记录运行时间，显示统计结果的时候使用了pstats这个工具来进行表格化显示。

参考Pycharm官网的help，点击这里

可知profile工具使用有三个步骤：

A profiler runs in the following order: vmprof, yappi, cProfile.

1. 开启profiling会话

点击菜单栏中Run->Profile 'XXX脚本'或者脚本编辑器页面右击菜单栏中的Profile 'XXX脚本'，然后在命令运行面板会出现类似下面的显示。

profile工具运行后，下方的输出面板会有三个项目，分别是

保存性能分析结果
停止分析
关闭分析面板

可以看到，点击第一个保存之后，保存的位置提示，对于windows来说默认保存的地方是在：<LOCALAPPDATAPATH>\JetBrains\<product><version>/snapshots，mac自己看，命名是当前项目（project name）的名称。

2. 查看profile结果

可以看到，使用pycharm的profile可视化工具之后，结果是一个XXX.pstat文件，其中有一部分是Statistics，另一部分是Call Graph。

2.1 Statistics面板

关于统计部分：

项目	描述
Name	函数名称
Call Count	当前函数被调用的次数
Time(ms)	这个函数及这个函数调用的函数总共花费的时间
Own Time(ms)	所选函数本身调用的时间

小技巧：
想在统计面板的Name列查找一个特定名称的函数/文件，可以任意点击一个cell，然后输入要搜索的东西。类似下面

另外，还可以右击每一行， Jump to the source code，跳转至源代码。函数对应的源代码就会出现在编辑框。

注意，不是所有的都可以跳转

分析的时候，可以先按照Call Count进行耗时从大到小排序，然后理清楚哪个调用了哪个，调用多次的，比如上图中调用1k多次的一般都是系统类型的调用，其他才是我们自己的，从上到下，依次去观察哪个比较耗时。

2.2 Call Graph

可以直接点击Call Graph这个tab，查看所有函数的调用关系图，也可以在Statistics面板，某个函数行右击Show On Call Graph，就可以直接跳转到该函数在Call graph图中对应位置。
如果一开始显示一堆矩形，没事，拖动/放大。

随便点点下面这些按钮，放大就对了

这些按钮的功能为（其他不重要，自己看提示的label也可以理解）：

项目	描述
+ / -	用来放大/减小这个图的，也可以直接按键盘的加号键/减号键（不需要按住shift）

然后就可以看到函数调用关系图，一般最下面一行是python脚本文件，从下往上看

最底层可能会有多个脚本，无所谓，点击线条可以highlight，继续往下点就好了

2. 其他测试时间的python库

主要参考：Python的7种性能测试工具：timeit、profile、cProfile、line_profiler、memory_profiler、PyCharm图形化性能测试工具、objgraph

我这里只列举自己可能会用到的几个及相关注意事项

2.1 itemit

python内置库，不需要额外安装

>>> import timeit
>>> def fun():
    for i in range(100000):
        a = i * i

>>> timeit.timeit('fun()', 'from __main__ import fun', number=1)
0.02922706632834235
>>>

timeit只输出被测试代码的总运行时间，单位为秒，没有详细的统计。

2.2 profile库

python内置库，不需要额外安装。

纯Python实现的性能测试模块，接口和cProfile一样。

用的时候直接把要测试的部分包在一个函数里，使用profile.run("XX()")即可，默认使用标准名称排序

>>> import profile
>>> def fun():
   for i in range(100000):
      a = i * i

      

>>> profile.run('fun()')
         5 function calls in 0.031 seconds

   Ordered by: standard name
	ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 :0(AddPath)
        1    0.000    0.000    0.000    0.000 :0(Execute)
        1    0.000    0.000    0.000    0.000 :0(POINTER)
       38    0.000    0.000    0.016    0.000 :0(__build_class__)
        1    0.000    0.000    0.000    0.000 :0(__deepcopy__)
     14/6    0.000    0.000    0.016    0.003 :0(__import__)
        5    0.000    0.000    0.000    0.000 :0(__new__)
        4    0.016    0.004    0.016    0.004 :0(_abc_init)
       25    0.000    0.000    0.000    0.000 :0(_fix_co_filename)
        2    0.000    0.000    0.000    0.000 :0(_getframe)
        7    0.000    0.000    0.000    0.000 :0(acquire)
      130    0.000    0.000    0.000    0.000 :0(acquire_lock)
       18    0.000    0.000    0.000    0.000 :0(add)
       52    0.000    0.000    0.000    0.000 :0(allocate_lock)


>>>

ncall：函数运行次数
tottime：函数的总的运行时间，减去函数中调用子函数的运行时间
第一个percall：percall = tottime / nclall
cumtime:函数及其所有子函数调整的运行时间，也就是函数开始调用到结束的时间。
第二个percall：percall = cumtime / nclall

但是这里排序是按照函数名称排序的，如果希望按照运行时间排序，可以使用

# 查看被调用次数最多的
profile.run('fun()',sort="cumulative")
# 查看耗时最长的
profile.run('fun()',sort="tottime")

可以使用的sort参数的取值有：

‘calls’ call count
‘cumulative’ cumulative time
‘cumtime’ cumulative time
‘file’ file name
‘filename’ file name
‘module’ file name
‘ncalls’ call count
‘pcalls’ primitive call count
‘line’ line number
'name’function name
'nfl’name/file/line
'stdname’standard name
'time’internal time
'tottime’internal time

参考：

Python3 标准库概览

相对于 timeit 的细粒度，:mod:profile 和 pstats 模块提供了针对更大代码块的时间度量工具。

Python的Profile概述

posted @ 2024-04-25 19:46 海_纳百川阅读(878) 评论(0) 编辑收藏举报

刷新页面返回顶部

不积跬步无以至千里

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己

Pycharm图形化性能测试工具Profile

1. PyCharm图形化性能测试工具Profile

1. 开启profiling会话

2. 查看profile结果

2.1 Statistics面板

2.2 Call Graph

2. 其他测试时间的python库

2.1 itemit

2.2 profile库

公告

不积跬步无以至千里

研究领域：深度学习，图像处理 联系方式：vladimirputin@foxmail.com 不必高看自己，也不必贬低自己

Pycharm图形化性能测试工具Profile

1. PyCharm图形化性能测试工具Profile

1. 开启profiling会话

2. 查看profile结果

2.1 Statistics面板

2.2 Call Graph

2. 其他测试时间的python库

2.1 itemit

2.2 profile库

公告

研究领域：深度学习，图像处理
联系方式：vladimirputin@foxmail.com
不必高看自己，也不必贬低自己