转 pstack 命令 分析mysql hang

pstack 主要分析mysql hang 的函数, 分析不了锁的情况,比较高深

 

参考文档

https://blog.csdn.net/n88Lpo/article/details/106484780

https://www.cnblogs.com/nanxiang/p/16012725.html

https://cloud.tencent.com/developer/article/1973397

 

##sample 1

故障分析 | MySQL 异地从库复制延迟案例一则

作者:任坤

现居珠海,先后担任专职 Oracle 和 MySQL DBA,现在主要负责 MySQL、mongoDB 和 Redis 维护工作。

本文来源:原创投稿

* 爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


1、背景

线上某核心 MySQL ,版本为 5.6,本地机房1主2从,同时部署了一个异地从库。

从2月14号起异地从库开始报警复制延迟,一开始以为是网络波动导致就没有处理,但是2天后该报警依然存在且延迟越来越高。

2、诊断

登录该异地从库,首先甄别是不是IO复制线程引发的延迟。

该步骤很简单,查看 show slave status 的 Master_Log_File 是不是主库当前的 binlog ,如果是说明IO复制线程没有延迟,那就是 SQL 复制 线程引起的。

获取该 mysqld 的进程 ID ,执行 perf record -ag -p 11029 -- sleep 10; perf report

反复执行多次,每次都有 deflate_slow 且占据比例最高

将其展开,和压缩页有关联

pstack 11029 多次抓取现场,也是和压缩页有关。

该实例确实有个大表,并且只有异地从库开启了页压缩,将其行格式转为 dynamic 。

查看 Seconds_Behind_Master,延迟指标开始逐步下降,说明该方案生效了。

再次抓取 perf 和 pstack 现场。

--perf report

--pstack

可以看到和页压缩相关的 API 已经消失,再次确认了本次复制延迟和大表开启页压缩有直接关系。

3、小结

借助 perf 和 pstack 工具,能很快定位是压缩表引发的 SQL 线程复制延迟,将大表解压缩后最终解决该问题。

本文关键字:#从库延迟# #perf# #pstack#


关于SQLE

爱可生开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。

如何获取

类型

地址

版本库

https://github.com/actiontech/sqle

文档

https://actiontech.github.io/sqle-docs-cn/

发布信息

https://github.com/actiontech/sqle/releases

数据审核插件开发文档

 

 

posted @ 2022-08-15 17:24  feiyun8616  阅读(308)  评论(0编辑  收藏  举报