MySQL数据库：Lock wait timeout exceeded； try restarting transaction问题解析及解决方案

MySQL数据库：Lock wait timeout exceeded; try restarting transaction问题解析及解决方案

一、背景描述
二、原因分析
三、解决方案
3.1 方案一事务信息查询
3.2 方案二如果杀掉线程依然不能解决，可以查找执行线程耗时比较久的任务，kill掉
3.3 方案三 innodb_lock_wait_timeout 锁定等待时间改大
3.4 方案四优化SQL语句
一、背景描述
MySQL数据库，版本号为 5.7.37 。其中有一个设备数据消息表，数据量为 130万多条。设备订阅的MQTT消息定时的会添加新的消息到此消息表中。

在维护项目过程中，由于设备更换，导致历史数据无法与新更换的设备对应上，导致历史数据丢失。为了解决这个问题，临时解决方案就是把历史数据关联的字段更换成新安装的设备的值。于是便有了以下操作。

UPDATE device_data_message SET device_id = 45, pillar_id = 10086, collect_id = 64
WHERE monitor_id IN ( SELECT monitor_id FROM (SELECT monitor_id FROM device_data_message WHERE pillar_id = 10010 AND collect_type = 1) a );

上述SQL语句在本地电脑执行正常（执行时间为29秒）。达到预期效果。但是同样的SQL语句跑到开发环境就不行了，执行了100多秒后，直接报 Lock wait timeout exceeded; try restarting transaction 这样的错误。

二、原因分析

因为使用的数据库为 MySQL，而 device_data_message 表的引擎是 InnoDB 表类型，此时会出现锁等待的情况，在出现锁等待时，会根据参数 innodb_lock_wait_timeout（默认50s）的配置，判断是否需要进行 timeout 的操作，如果等待时间超过了设置的时间就会报错。如下图所示：

按照经验和网上搜索列举锁等待超时出现的情况：

1、多台服务器同时操作同一数据库。
2、在同一事务内先后对同一条数据进行插入和更新操作。
3、同时对同一张表进行插入和更新操作。
4、事务A对记录C进行更新/删除操作的请求未commit时，事务B也对记录C进行更新/删除操作。此时，B会等A提交事务，释放行锁。当等待时间超过innodb_lock_wait_timeout设置值时，会产生“LOCK WAIT”事务。
5、数据库内存不足，导致无法执行写操作。
6、瞬时出现高并发现象，Spring事务造成数据库死锁，后续操作超时抛出异常。

三、解决方案
可以使用 information_schema 查询数据库使用情况。information_schema 这个数据库保存了 MySQL 服务器所有数据库的信息。

如数据库名，数据库的表，表栏的数据类型与访问权限等。也就是说，这台 MySQL 服务器上，到底有哪些数据库、各个数据库有哪些表，每张表的字段类型是什么，各个数据库要什么权限才能访问等等信息都保存在 information_schema 库里面。

1、SELECT * FROM information_schema.INNODB_TRX; – 当前运行的所有事务
2、SELECT * FROM information_schema.INNODB_LOCKS; – 当前出现的锁
3、SELECT * FROM information_schema.INNODB_LOCK_WAITS; – 锁等待的对应关系

3.1 方案一事务信息查询
通过SELECT * FROM information_schema.innodb_trx查询未提交事务，查到一个一直没有提交的只读事务（trx_state=”LOCK WAIT”），找到对应线程，执行：kill 线程ID。线程id为表中的trx_mysql_thread_id字段。

如果数据库中有锁的话，查看 innodb_trx就可以看到对应的信息。通过查询知道是哪条语句锁了，图中红色语句为占用系统资源的语句，我们需要杀掉这个锁，执行 kill 线程id号。上面这条记录的id为319618246 ，所以我们执行：kill 319618246即可。以下为执行前后对比：

执行以后的情况：

3.2 方案二如果杀掉线程依然不能解决，可以查找执行线程耗时比较久的任务，kill掉

执行SELECT * from information_schema.PROCESSLIST WHERE Time > 1000 AND USER = ‘xxx’ ORDER BY TIME desc;找到线程：kill 线程ID。

具体接成KILL 语句如下，然后批量KILL.

select concat('kill ', id, ';')  from information_schema.PROCESSLIST WHERE Time > 1000 AND USER = ‘xxx’ ORDER BY TIME desc;

3.3 方案三 innodb_lock_wait_timeout 锁定等待时间改大

修改超时时间将 #innodb_lock_wait_timeout = 50 修改为 innodb_lock_wait_timeout = 500。

缺点：全局更改，影响也是全局的，等待时间加长，容易使等待事务增多导致堆积问题。

3.4 方案四优化SQL语句
对于我上面的更新操作的写法，优化了一下，效率提高了10倍左右。以下是优化后的写法：

即在数据库中创建一个临时表（比如下面的 t_test_a 表），用于存放上述SQL语句中查询出来的子结果避免使用IN字段导致扫描全表。

UPDATE device_data_monitor ddm INNER JOIN t_test_a tta ON ddm.monitor_id = tta.monitor_id
SET device_id = 45, pillar_id = 29, collect_id = 64

本文完结！

摘自：No8g攻城狮

原文链接：https://blog.csdn.net/weixin_44299027/article/details/135092678

posted @ 2024-06-04 16:19 人生苦短，知足常乐！阅读(8733) 评论(0) 收藏举报

刷新页面返回顶部

非淡泊无以明志,非宁静无以致远

MySQL数据库：Lock wait timeout exceeded； try restarting transaction问题解析及解决方案

公告