博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

pt-kill使用

Posted on 2016-12-27 15:32  moss_tan_jun  阅读(761)  评论(0编辑  收藏  举报

percona-toolkit-2.2.10使用举例
以pt-kill为例 --help,可以看到帮助信息

--------

运行平稳的数据库,如果遇到CPU狂飙,到80%左右,那一定是开发写的烂SQL导致的,DBA首先要保证的是,数据库别跑挂了,所以我们要把那些运行慢的SQL杀死并记录到文件里,以便后面的排查。

pt-kill  --match-info "^(select|SELECT)" --busy-time 3 --victim all --interval 1 --kill --print --daemonize > /root/kill.txt

-------
需要注意的事情:
--victims all需要有,否则只会处理一个连接(最早连上数据库的那个),
--interval 30 默认每30秒循环执行一次,可以根据实际情况调整,如果不加,只执行一次;加上的话,会在后台不停的执行。
默认会过滤掉复制线程,请不必担心杀掉复制线程。
--run-time,如果指定此项,则执行指定长的时候,否则以循环时间每多次时间执行一次。
--help可以查看帮助信息,除了--busy-time与--idle-time是否定的关系,只能选择一个;其余各个选项是并的关系,是A且B的关系,--ignore选项与--match信息可以一起使用。
使用的重点即是--ignore 与 --match的灵活

说明:下面例子中--print只是打印出依据前面的条件要杀的连接信息,用于先验证, --kill则真正执行。

下面是例子每10秒打印出sleep超过10000秒的连接信息:
./pt-kill --idle-time 10000 --victims all --interval 10 -S /export/data/MySQL/tmp/mysql.sock --password=123456 --print

下面是每10秒杀掉所有sleep超过10000秒的连接,将print 修改成kill即可,后面的例子,杀掉进程的时候,直接修改成 --kill即可。
./pt-kill --idle-time 10000 --victims all --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --kill

每10秒杀掉192.168.137.100的所有sleep超过200s的连接。
./pt-kill --victims all --match-host='192.168.137.100' --match-command='Sleep' --idle-time=200 --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print

每10秒杀掉连接特定db的所有sleep超过200s的连接
./pt-kill --victims all --match-db='jdmysqlmgrsys' --idle-time=2000 --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print
每10秒杀掉特定应用ip连接特定ip的sleep超过200s的连接。
./pt-kill --victims all --match-db='jdmysqlmgrsys' --match-host='192.168.137.100' --idle-time=2000 --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print
每10秒 杀掉特定DB的特定账号的sleep超过2000s的链接
./pt-kill --victims all --match-db='jdmysqlmgrsys' --match-user='jdmysqlmgrsys_rw' --idle-time=2000 --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print

每10秒 杀掉执行时间超过特定时间的特定sql(10秒),例子1:,支持正则表达式,特殊符号需要转义
./pt-kill --victims all --busy-time=10 --match-info="select sleep(45)" --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print

每10秒杀掉执行时间超过特定时间、特定ql(5秒)的连接,例子2:
./pt-kill --victims all --busy-time=5 --match-info="select id,image,image2,image3,maidian,title,team_price,market_price.*" --interval 10 -S /export/data/mysql/tmp/mysql.sock --password=123456 --print

 

---------------

使用范例:
pt-kill --log-dsn D=testdb,t=kill_log --create-log-table --host=host2 --user=root --password=root --port=3306 --busy-time=10 --print --kill-query --match-info "SELECT|select"  --victims all

也可使用--config写配置文件:
pt-kill --config tmp.txt --log-dsn D=testdb,t=kill_log --create-log-table --match-info "SELECT|select" --victims all
notes: --match-info 是区分大小写的,匹配SELECT也就意味着对select无法匹配,因此使用"SELECT|select"包含大小写

cat tmp.txt 
host=host2
user=root
password=root
port=3306
busy-time=10
print 
kill-query

该使用范例的作用:
如果不存在testdb.kill_log表,则创建该表,然后将所有pt-kill的操作记录到该表中。对所有查询时间超过10秒的SELECT语句进行print显示出来,同时会kill该query。
pt-kill 默认检查间隔为5秒

解释:
--log-dsn D=testdb,t=kill_log --create-log-table  是创建testdb.kill_log表,之后将pt-kill操作的日志记录在表中
--busy-time=10 执行时间超过10秒的
--print --kill-query   动作是 进行print和 kill query,除此之外的动作还有kill 连接:--kill
--match-info 'SELECT|select'  只匹配SELECT 语句


其他一些重要的参数解释:

--interval 运行检查query的间隔,
--victim
oldest (默认值),只杀最老的查询(最先发起的)。这是防止被查杀是不是真的长时间运行的查询,他们只是长期等待。这种种匹配按时间查询,杀死一个时间最高值。
        all 杀掉所有满足的线程
        all-but-oldest 杀死所有,但最长的保留不杀
--busy-time 批次查询已运行的时间超过这个时间的线程;
--idle-time 杀掉sleep 了多少时间的连接线程,必须在--match-command sleep时才有效


接下来这一组参数,是针对show processlist中相应列的 忽略 或 匹配:
--ignore-command / --match-command  
(command有:Query、Sleep、Binlog Dump、Connect、Delayed insert、Execute、Fetch、Init DB、Kill、Prepare、Processlist、Quit、Reset stmt、Table Dump)
--ignore-db      / --match-db
--ignore-host    / --match-host
--ignore-info    / --match-info
(info则可以使用select、update、insert、delete来进行匹配,并可使用"|"进行多项匹配,如"select|SELECT|delete|DELETE|update|UPDATE"
--ignore-state   / --match-state
(state类型有:Locked、login、copy to tmp table、Copying to tmp table、Copying to tmp table on disk、Creating tmp table、executing、Reading from net、Sending data、Sorting for order、Sorting result、Table lock、Updating)
--ignore-user    / --match-user



Action:
--kill                 杀掉连接并且退出
--kill-query           只杀掉连接执行的语句,但是线程不会被终止
--print                打印满足条件的语句