mysql 死锁原因及解决办法
Mysql 锁类型
一、锁类型介绍:
MySQL 有三种锁的级别:页级、表级、行级。
- 表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。
- 行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高。
- 页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度一般
算法:
- next KeyLocks 锁,同时锁住记录 (数据),并且锁住记录前面的 Gap
- Gap 锁,不锁记录,仅仅记录前面的 Gap
- Recordlock 锁(锁数据,不锁 Gap)
- 所以其实 Next-KeyLocks=Gap 锁 + Recordlock 锁
二、死锁产生原因和示例
1、产生原因:
死锁:是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。
此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。表级锁不会产生死锁。
所以解决死锁主要还是针对于最常用的 InnoDB。
死锁的关键在于:两个 (或以上) 的 Session 加锁的顺序不一致。
那么对应的解决死锁问题的关键就是:让不同的 session 加锁有次序
2、产生示例:
案例一
需求:将投资的钱拆成几份随机分配给借款人。
起初业务程序思路是这样的:
将投资人投资金额随机分为几份,然后随机从借款人表里面选几个,然后通过一条条 select for update 去更新借款人表里面的余额等。
例如两个用户同时投资,A 用户金额随机分为 2 份,分给借款人 1,2
B 用户金额随机分为 2 份,分给借款人 2,1
由于加锁的顺序不一样,死锁当然很快就出现了。
对于这个问题的改进很简单,直接把所有分配到的借款人直接一次锁住就行了。
select * from xxx where id in (xx,xx,xx) for update
在 in 里面的列表值 mysql 是会自动从小到大排序,加锁也是一条条从小到大加的锁
例如(以下会话 id 为主键):
Session1:
mysql> select * from t3 where id in (8,9) for update;
+----+--------+------+---------------------+
| id | course | name | ctime |
+----+--------+------+---------------------+
| 8 | WA | f | 2016-03-02 11:36:30 |
| 9 | JX | f | 2016-03-01 11:36:30 |
+----+--------+------+---------------------+
rows in set (0.04 sec)
select * from t3 where id in (10,8,5) for update;
锁等待中……
其实这个时候 id=10 这条记录没有被锁住的,但 id=5 的记录已经被锁住了,锁的等待在 id=8 的这里 不信请看
Session3:
mysql> select * from t3 where id=5 for update;
锁等待中Session4:
mysql> select * from t3 where id=10 for update;
+----+--------+------+---------------------+
| id | course | name | ctime |
+----+--------+------+---------------------+
| 10 | JB | g | 2016-03-10 11:45:05 |
+----+--------+------+---------------------+
row in set (0.00 sec)
在其它 session 中 id=5 是加不了锁的,但是 id=10 是可以加上锁的。
案例二
在开发中,经常会做这类的判断需求:根据字段值查询(有索引),如果不存在,则插入;否则更新。
以 id 为主键为例,目前还没有 id=22 的行
Session1:
select * from t3 where id=22 for update;
Empty set (0.00 sec)
session2:
select * from t3 where id=23 for update;
Empty set (0.00 sec)
Session1:
insert into t3 values(22,'ac','a',now());
锁等待中……
Session2:
insert into t3 values(23,'bc','b',now());
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
当对存在的行进行锁的时候 (主键),mysql 就只有行锁。
当对未存在的行进行锁的时候 (即使条件为主键),mysql 是会锁住一段范围(有 gap 锁)
锁住的范围为:
(无穷小或小于表中锁住 id 的最大值,无穷大或大于表中锁住 id 的最小值)
如:如果表中目前有已有的 id 为(11 , 12)
那么就锁住(12,无穷大)
如果表中目前已有的 id 为(11 , 30)
那么就锁住(11,30)
对于这种死锁的解决办法是:
insert into t3(xx,xx) on duplicate key update `xx`='XX';
用 mysql 特有的语法来解决此问题。因为 insert 语句对于主键来说,插入的行不管有没有存在,都会只有行锁
搜索 Java 知音公众号,回复 “后端面试”,送你一份 Java 面试题宝典.pdf
案例三
mysql> select * from t3 where id=9 for update;
+----+--------+------+---------------------+
| id | course | name | ctime |
+----+--------+------+---------------------+
| 9 | JX | f | 2016-03-01 11:36:30 |
+----+--------+------+---------------------+
row in set (0.00 sec)
Session2:
mysql> select * from t3 where id<20 for update;
锁等待中
Session1:
mysql> insert into t3 values(7,'ae','a',now());
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
这个跟案例一其它是差不多的情况,只是 session1 不按常理出牌了,
Session2 在等待 Session1 的 id=9 的锁,session2 又持了 1 到 8 的锁(注意 9 到 19 的范围并没有被 session2 锁住),最后,session1 在插入新行时又得等待 session2, 故死锁发生了。
这种一般是在业务需求中基本不会出现,因为你锁住了 id=9,却又想插入 id=7 的行,这就有点跳了,当然肯定也有解决的方法,那就是重理业务需求,避免这样的写法。
案例四

案例四
一般的情况,两个 session 分别通过一个 sql 持有一把锁,然后互相访问对方加锁的数据产生死锁。
案例五

案例五
两个单条的 sql 语句涉及到的加锁数据相同,但是加锁顺序不同,导致了死锁。
案例六
死锁场景如下:
表结构:
CREATE TABLE dltask (
id bigint unsigned NOT NULL AUTO_INCREMENT COMMENT ‘auto id’,
a varchar(30) NOT NULL COMMENT ‘uniq.a’,
b varchar(30) NOT NULL COMMENT ‘uniq.b’,
c varchar(30) NOT NULL COMMENT ‘uniq.c’,
x varchar(30) NOT NULL COMMENT ‘data’,
PRIMARY KEY (id),
UNIQUE KEY uniq_a_b_c (a, b, c)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=’deadlock test’;
a,b,c 三列,组合成一个唯一索引,主键索引为 id 列。
事务隔离级别:
RR (Repeatable Read)
每个事务只有一条 SQL:
delete from dltask where a=? and b=? and c=?;
SQL 的执行计划:

执行计划
死锁日志:

死锁日志
众所周知,InnoDB 上删除一条记录,并不是真正意义上的物理删除,而是将记录标识为删除状态。(注:这些标识为删除状态的记录,后续会由后台的 Purge 操作进行回收,物理删除。但是,删除状态的记录会在索引中存放一段时间。) 在 RR 隔离级别下,唯一索引上满足查询条件,但是却是删除记录,如何加锁?InnoDB 在此处的处理策略与前两种策略均不相同,或者说是前两种策略的组合:对于满足条件的删除记录,InnoDB 会在记录上加 next key lock X (对记录本身加 X 锁,同时锁住记录前的 GAP,防止新的满足条件的记录插入。) Unique 查询,三种情况,对应三种加锁策略,总结如下:
此处,我们看到了 next key 锁,是否很眼熟?对了,前面死锁中事务 1,事务 2 处于等待状态的锁,均为 next key 锁。明白了这三个加锁策略,其实构造一定的并发场景,死锁的原因已经呼之欲出。但是,还有一个前提策略需要介绍,那就是 InnoDB 内部采用的死锁预防策略。
- 找到满足条件的记录,并且记录有效,则对记录加 X 锁,No Gap 锁 (lock_mode X locks rec but not gap);
- 找到满足条件的记录,但是记录无效 (标识为删除的记录),则对记录加 next key 锁 (同时锁住记录本身,以及记录之前的 Gap:lock_mode X);
- 未找到满足条件的记录,则对第一个不满足条件的记录加 Gap 锁,保证没有满足条件的记录插入 (locks gap before rec);
死锁预防策略
InnoDB 引擎内部 (或者说是所有的数据库内部),有多种锁类型:事务锁 (行锁、表锁),Mutex (保护内部的共享变量操作)、RWLock (又称之为 Latch,保护内部的页面读取与修改)。
InnoDB 每个页面为 16K,读取一个页面时,需要对页面加 S 锁,更新一个页面时,需要对页面加上 X 锁。任何情况下,操作一个页面,都会对页面加锁,页面锁加上之后,页面内存储的索引记录才不会被并发修改。
因此,为了修改一条记录,InnoDB 内部如何处理:
- 根据给定的查询条件,找到对应的记录所在页面;
- 对页面加上 X 锁 (RWLock),然后在页面内寻找满足条件的记录;
- 在持有页面锁的情况下,对满足条件的记录加事务锁 (行锁:根据记录是否满足查询条件,记录是否已经被删除,分别对应于上面提到的 3 种加锁策略之一);
相对于事务锁,页面锁是一个短期持有的锁,而事务锁 (行锁、表锁) 是长期持有的锁。因此,为了防止页面锁与事务锁之间产生死锁。InnoDB 做了死锁预防的策略:持有事务锁 (行锁、表锁),可以等待获取页面锁;但反之,持有页面锁,不能等待持有事务锁。
根据死锁预防策略,在持有页面锁,加行锁的时候,如果行锁需要等待。则释放页面锁,然后等待行锁。此时,行锁获取没有任何锁保护,因此加上行锁之后,记录可能已经被并发修改。因此,此时要重新加回页面锁,重新判断记录的状态,重新在页面锁的保护下,对记录加锁。如果此时记录未被并发修改,那么第二次加锁能够很快完成,因为已经持有了相同模式的锁。但是,如果记录已经被并发修改,那么,就有可能导致本文前面提到的死锁问题。
以上的 InnoDB 死锁预防处理逻辑,对应的函数,是 row0sel.c::row_search_for_mysql ()。感兴趣的朋友,可以跟踪调试下这个函数的处理流程,很复杂,但是集中了 InnoDB 的精髓。搜索 Java 知音公众号,回复 “后端面试”,送你一份 Java 面试题宝典.pdf
剖析死锁的成因
做了这么多铺垫,有了 Delete 操作的 3 种加锁逻辑、InnoDB 的死锁预防策略等准备知识之后,再回过头来分析本文最初提到的死锁问题,就会手到拈来,事半而功倍。
首先,假设 dltask 中只有一条记录:(1, ‘a’, ‘b’, ‘c’, ‘data’)。三个并发事务,同时执行以下的这条 SQL:
delete from dltask where a=’a’ and b=’b’ and c=’c’;
并且产生了以下的并发执行逻辑,就会产生死锁:

并发执行逻辑
上面分析的这个并发流程,完整展现了死锁日志中的死锁产生的原因。其实,根据事务 1 步骤 6,与事务 0 步骤 3/4 之间的顺序不同,死锁日志中还有可能产生另外一种情况,那就是事务 1 等待的锁模式为记录上的 X 锁 + No Gap 锁 (lock_mode X locks rec but not gap waiting)。这第二种情况,也是” 润洁” 同学给出的死锁用例中,使用 MySQL 5.6.15 版本测试出来的死锁产生的原因。
此类死锁,产生的几个前提:
- Delete 操作,针对的是唯一索引上的等值查询的删除;(范围下的删除,也会产生死锁,但是死锁的场景,跟本文分析的场景,有所不同)
- 至少有 3 个 (或以上) 的并发删除操作;
- 并发删除操作,有可能删除到同一条记录,并且保证删除的记录一定存在;
- 事务的隔离级别设置为 Repeatable Read,同时未设置 innodb_locks_unsafe_for_binlog 参数 (此参数默认为 FALSE);(Read Committed 隔离级别,由于不会加 Gap 锁,不会有 next key,因此也不会产生死锁)
- 使用的是 InnoDB 存储引擎;(废话!MyISAM 引擎根本就没有行锁)
如何检测代码运行是否出现死锁
解除正在死锁的状态有两种方法:
第一种:
1.查询是否锁表
show OPEN TABLES where In_use > 0;
2.查询进程(如果您有SUPER权限,您可以看到所有线程。否则,您只能看到您自己的线程)
show processlist
3.杀死进程id(就是上面命令的id列)
kill id
第二种:
1.查看下在锁的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;
2.杀死进程id(就是上面命令的trx_mysql_thread_id列)
kill 线程ID
例子:
查出死锁进程:SHOW PROCESSLIST
杀掉进程 KILL 420821;
其它查看死锁的命令:
1:查看当前的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;
2:查看当前锁定的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;
3:查看当前等锁的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS;
MySQL 死锁检查处理
正常情况下,死锁发生时,权重最小的连接将被kill并回滚。但是为了找出语句来优化,启用可启用死锁将死锁信息记录下来。
#step 1:窗口一
mysql> start transaction;
mysql> update aa set name='aaa' where id = 1;
#step 2:窗口二
mysql> start transaction;
mysql> update bb set name='bbb' where id = 1;
#step 3:窗口一
mysql> update bb set name='bbb';
#step 4:窗口三
#是否自动提交
mysql> show variables like 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit | ON |
+---------------+-------+
#查看当前连接
mysql> show processlist;
mysql> show full processlist;
mysql> SELECT * FROM INFORMATION_SCHEMA.PROCESSLIST;
+----+------+-----------+------+---------+------+-------+------------------+
| Id | User | Host | db | Command | Time | State | Info |
+----+------+-----------+------+---------+------+-------+------------------+
| 4 | root | localhost | test | Sleep | 244 | | NULL |
| 5 | root | localhost | test | Sleep | 111 | | NULL |
| 6 | root | localhost | NULL | Query | 0 | init | show processlist |
+----+------+-----------+------+---------+------+-------+------------------+
#查看当前正在被锁的事务(锁请求超时后则查不到)
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+
| lock_id | lock_trx_id | lock_mode | lock_type | lock_table | lock_index | lock_space | lock_page | lock_rec | lock_data |
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+
| 130718495:65:3:4 | 130718495 | X | RECORD | `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 | 4 | 0x000000000300 |
| 130718496:65:3:4 | 130718496 | X | RECORD | `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 | 4 | 0x000000000300 |
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+
#查看当前等待锁的事务(锁请求超时后则查不到)
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS;
+-------------------+-------------------+-----------------+------------------+
| requesting_trx_id | requested_lock_id | blocking_trx_id | blocking_lock_id |
+-------------------+-------------------+-----------------+------------------+
| 130718499 | 130718499:65:3:4 | 130718500 | 130718500:65:3:4 |
+-------------------+-------------------+-----------------+------------------+
#查看当前未提交的事务(如果死锁等待超时,事务可能还没有关闭)
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;
+--------------------------------------------------------------------------------------------------------+
| trx_id | trx_state | trx_started | trx_requested_lock_id | trx_wait_started | trx_weight |
+-----------+-----------+---------------------+-----------------------+---------------------+------------+
| 130718500 | RUNNING | 2018-03-12 09:28:10 | NULL | NULL | 3 |
| 130718499 | LOCK WAIT | 2018-03-12 09:27:59 | 130718499:65:3:4 | 2018-03-12 09:32:48 | 5 |
==========================================================================================================
| trx_mysql_thread_id | trx_query | trx_operation_state | trx_tables_in_use |
+---------------------+---------------------------------------+---------------------+-------------------+
| 4 | NULL | NULL | 0 |
| 5 | update bb set name='bbb' | starting index read | 1 |
=========================================================================================================
| trx_tables_locked | trx_lock_structs | trx_lock_memory_bytes | trx_rows_locked | trx_rows_modified |
+-------------------+------------------+-----------------------+-----------------+-------------------+
| 0 | 2 | 360 | 3 | 1 |
| 1 | 4 | 1184 | 4 | 1 |
===========================================================================================================================
| trx_concurrency_tickets | trx_isolation_level | trx_unique_checks | trx_foreign_key_checks | trx_last_foreign_key_error |
+-------------------------+---------------------+-------------------+------------------------+----------------------------+
| 0 | REPEATABLE READ | 1 | 1 | NULL |
| 0 | REPEATABLE READ | 1 | 1 | NULL |
===========================================================================================================================
| trx_adaptive_hash_latched | trx_adaptive_hash_timeout | trx_is_read_only | trx_autocommit_non_locking |
+---------------------------+---------------------------+------------------+----------------------------+
| 0 | 10000 | 0 | 0 |
| 0 | 10000 | 0 | 0 |
+---------------------------+---------------------------+------------------+----------------------------+
#查看正在被访问的表
mysql> show OPEN TABLES where In_use > 0;
+----------+-------+--------+-------------+
| Database | Table | In_use | Name_locked |
+----------+-------+--------+-------------+
| test | bb | 1 | 0 |
+----------+-------+--------+-------------+
#step 3:窗口一 (若第三步中锁请求太久,则出现锁超时而终止执行)
mysql> update bb set name='bbb';
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
#"窗口一" 锁请求超时前,执行第五步,使死锁产生,则该连接 "窗口二" 执行终止,"窗口一" 顺利执行
#step 5:窗口二
mysql> update aa set name='aa';
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction
查看最近一个死锁情况
#查看最近一个死锁情况
mysql> SHOW ENGINE INNODB STATUS\G ;
...............
------------------------
LATEST DETECTED DEADLOCK
------------------------
2018-03-12 11:01:06 7ffb4993a700 #发生时间
*** (1) TRANSACTION: #事务1
TRANSACTION 130718515, ACTIVE 19 sec starting index read
mysql tables in use 1, locked 1 #正被访问的表
LOCK WAIT 4 lock struct(s), heap size 1184, 4 row lock(s), undo log entries 1 #影响行数
MySQL thread id 5, OS thread handle 0x7ffb498f8700, query id 205 localhost root updating #线程/连接host/用户
update bb set name='bb' #请求语句
*** (1) WAITING FOR THIS LOCK TO BE GRANTED: #等待以下资源 (锁定位置及锁模式)
RECORD LOCKS space id 65 page no 3 n bits 72 index `GEN_CLUST_INDEX` of table `test`.`bb` trx id 130718515 lock_mode X waiting
Record lock, heap no 5 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
0: len 6; hex 000000000300; asc ;;
1: len 6; hex 000007ca9b34; asc 4;;
2: len 7; hex 1f000002092075; asc u;;
3: len 4; hex 80000001; asc ;;
4: len 2; hex 6262; asc bb;;
*** (2) TRANSACTION: #事务2
TRANSACTION 130718516, ACTIVE 14 sec starting index read
mysql tables in use 1, locked 1
4 lock struct(s), heap size 1184, 4 row lock(s), undo log entries 1
MySQL thread id 4, OS thread handle 0x7ffb4993a700, query id 206 localhost root updating
update aa set name='aa' #请求语句
*** (2) HOLDS THE LOCK(S): #持有锁资源
RECORD LOCKS space id 65 page no 3 n bits 72 index `GEN_CLUST_INDEX` of table `test`.`bb` trx id 130718516 lock_mode X
Record lock, heap no 1 PHYSICAL RECORD: n_fields 1; compact format; info bits 0
0: len 8; hex 73757072656d756d; asc supremum;;
Record lock, heap no 3 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
0: len 6; hex 000000000301; asc ;;
1: len 6; hex 000007ca9b17; asc ;;
2: len 7; hex 9000000144011e; asc D ;;
3: len 4; hex 80000002; asc ;;
4: len 2; hex 6262; asc bb;;
Record lock, heap no 5 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
0: len 6; hex 000000000300; asc ;;
1: len 6; hex 000007ca9b34; asc 4;;
2: len 7; hex 1f000002092075; asc u;;
3: len 4; hex 80000001; asc ;;
4: len 2; hex 6262; asc bb;;
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 64 page no 3 n bits 80 index `GEN_CLUST_INDEX` of table `test`.`aa` trx id 130718516 lock_mode X waiting
Record lock, heap no 7 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
0: len 6; hex 000000000200; asc ;;
1: len 6; hex 000007ca9b33; asc 3;;
2: len 7; hex 1e000001d53057; asc 0W;;
3: len 4; hex 80000001; asc ;;
4: len 2; hex 6161; asc aa;;
*** WE ROLL BACK TRANSACTION (2)
...............
#死锁记录只记录最近一个死锁信息,若要将每个死锁信息都保存到错误日志,启用以下参数:
mysql> show variables like 'innodb_print_all_deadlocks';
+----------------------------+-------+
| Variable_name | Value |
+----------------------------+-------+
| innodb_print_all_deadlocks | OFF |
+----------------------------+-------+
#上面 【step 3:窗口一】若一直请求不到资源,默认50秒则出现锁等待超时。
mysql> show variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50 |
+--------------------------+-------+
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
#设置全局变量 锁等待超时为60秒(新的连接生效)
#mysql> set session innodb_lock_wait_timeout=50;
mysql> set global innodb_lock_wait_timeout=60;
#上面测试中,当事务中的某个语句超时只回滚该语句,事务的完整性属于被破坏了。为了回滚这个事务,启用以下参数:
mysql> show variables like 'innodb_rollback_on_timeout';
+----------------------------+-------+
| Variable_name | Value |
+----------------------------+-------+
| innodb_rollback_on_timeout | OFF |
+----------------------------+-------+
最终参数设置如下:(重启服务重新连接测试)
[mysqld]
log-error =/var/log/mysqld3306.log
innodb_lock_wait_timeout=60 #锁请求超时时间(秒)
innodb_rollback_on_timeout = 1 #事务中某个语句锁请求超时将回滚真个事务
innodb_print_all_deadlocks = 1 #死锁都保存到错误日志
#若手动删除堵塞会话,删除 Command='Sleep' 、无State、无Info、trx_weight 权重最小的。
show processlist;
SELECT trx_mysql_thread_id,trx_state,trx_started,trx_weight FROM INFORMATION_SCHEMA.INNODB_TRX;
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· NetPad:一个.NET开源、跨平台的C#编辑器
· 面试官:你是如何进行SQL调优的?