CPU消耗，跟踪定位理论与实践

CPU消耗，跟踪定位理论与实践

一．性能指标之资源指标定位方案

1、打tprof报告方法

抓取perfpmr文件 60秒。
perfpmr.sh 60
从结果文件中取出tprof.sum

或直接抓取tprof
tprof –uskejzlt –x sleep 60

2、分析思路

首先看是Kernel、User、Shared Library中的那个方面占比消耗高。例如，如果是share lib占比比较高，则找到对应的share lib分页，查看具体哪个lib占用CPU高，再查看这个特定的lib中哪个函数占用CPU高。

如果通过以上方法不能定位到一个应用层的函数，而是定位到消耗CPU最高的是个系统函数。不但不认识这个系统函数，也看不出谁调用了这个系统函数，因为一些系统层的函数是通用函数（比如h_cede_end_point），从这类函数并不能看出是谁在调用。这种情况，可以通过这个系统函数相邻的那些能看懂的函数来猜测，因为占用CPU高的函数往往是同一个应用、同一个模块、同一类系统调用导致，他们具有扎堆出现的特点。

如果是kernal->lock占 2~3% cpu就是很多了。

如果定位到一个进程有问题，可以用Truss –c –p pid查看一个进程在干什么，比如，是在做fork，还是文件读写。

3. 示例

二．理论分析，到底谁在消耗cpu?

用户+系统+IO等待+软硬中断+空闲

祸首是谁？

用户

用户空间CPU消耗，各种逻辑运算
正在进行大量tps
函数/排序/类型转化/逻辑IO访问…
用户空间消耗大量cpu，产生的系统调用是什么？那些函数使用了cpu周期？
IO等待

等待IO请求的完成

此时CPU实际上空闲
如vmstat中的wa 很高。但IO等待增加，wa也不一定会上升（请求I/O后等待响应，但进程从核上移开了）

产生影响

用户和IO等待消耗了大部分cpu

吞吐量下降（tps）
查询响应时间增加

慢查询数增加

对mysql的并发陡增，也会产生上诉影响

三．如何减少CPU消耗？

减少等待

减少IO量

SQL/index，使用合适的索引减少扫描的行数（需平衡索引的正收益和维护开销，空间换时间）
提升IO处理能力
加cache/加磁盘/SSD

减少计算

减少逻辑运算量

避免使用函数，将运算转移至易扩展的应用服务器中如substr等字符运算，dateadd/datesub等日期运算，abs等数学函数

减少排序，利用索引取得有序数据或避免不必要排序如union all代替 union，order by 索引字段等

禁止类型转换，使用合适类型并保证传入参数类型与数据库字段类型绝对一致如数字用tiny/int/bigint等，必需转换的在传入数据库之前在应用中转好

简单类型，尽量避免复杂类型，降低由于复杂类型带来的附加运算。更小的数据类型占用更少的磁盘、内存、cpu缓存和cpu周期

减少逻辑IO量

index，优化索引，减少不必要的表扫描如增加索引，调整组合索引字段顺序，去除选择性很差的索引字段等等

table，合理拆分，适度冗余如将很少使用的大字段拆分到独立表，非常频繁的小字段冗余到“引用表”

SQL，调整SQL写法，充分利用现有索引，避免不必要的扫描，排序及其他操作如减少复杂join，减少order by，尽量union all，避免子查询等

数据类型，够用就好，减少不必要使用大字段如tinyint够用就别总是int，int够用也别老bigint，date够用也别总是timestamp

减少query请求量（非数据库本身）

适当缓存，降低缓存数据粒度，对静态并被频繁请求的数据进行适当的缓存如用户信息，商品信息等

优化实现，尽量去除不必要的重复请求如禁止同一页面多次重复请求相同数据的问题，通过跨页面参数传递减少访问等
合理需求，评估需求产出比，对产出比极端底下的需求合理去除

升级cpu若经过减少计算和减少等待后还不能满足需求，cpu利用率还高T_T 是时候拿出最后的杀手锏了，升级cpu，是选择更快的cpu还是更多的cpu了？

低延迟（快速响应），需要更快的cpu（每个查询只能使用一个cpu）

高吞吐，同时运行很多查询语句，能从多个cpu处理查询中收益

posted @ 2020-04-20 20:15 吴建明wujianming 阅读(310) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识（上）
· 浏览器原生「磁吸」效果！Anchor Positioning 锚点定位神器解析
· 没有源码，如何修改代码逻辑？

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:云计算服务器技术市场分析
Super Pi linux工具可以提供下吗？网上包括官方的都没法在centos、ubuntu os下跑，

xuxu8511@163.com 多谢。
--xu111122
2. Re:RISC-V指令列表分析
jalr中的14到12位应该为000而不是010吧
--洛天V
3. Re:《LLVM编译器原理与实践》新书推荐（已出版）
已买，学习中，支持博主
--tieyan
4. Re:NPU与超异构计算杂谈
好文章，很详细的对异构做了Overview！感谢大佬🫡
--kaiZH
5. Re:《LLVM编译器原理与实践》新书推荐（已出版）
这本书中对于LLVM垃圾回收机制statepoint有做研究吗？或者博主有推荐的资料吗？官网的资料确实比较晦涩难懂而且没有案例。
--wingrez