第十节:MySQL锁、事务隔离级别、MVCC机制详解、间隙锁、死锁等
一. 简介
可参考之前的文章:https://www.cnblogs.com/yaopengfei/p/11394728.html (用EFCore演示了事务隔离级别)
1. 锁定义
锁是计算机协调多个进程或线程并发访问某一资源的机制。
在数据库中,除了传统的计算资源(如CPU、RAM、I/O等)的争用以外,数据也是一种供需要用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素 。
2. 锁分类
(1). 从性能上:乐观锁和悲观锁。
A. 乐观锁: 通过rowversion比较数据的版本号,如果和最初数据不一致,则返回错误信息给用户,让用户决定下一步怎么办。
B. 悲观锁:修改数据前先加锁 锁定,防止其他人修改。
(2). 从对数据库操作上:读锁和写锁 (都属于悲观锁)。
A. 读锁(共享锁):针对同一份数据,多个读操作可以同时进行而不会互相影响。
B. 写锁(排它锁):当前写操作没有完成前,它会阻断其他写锁和读锁。
(3). 从对数据操作的颗粒上:表锁和行锁。
A. 表锁:每次操作锁住整张表。开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。 (MyISAM存储引擎)
B. 行锁:每次操作锁住一行数据。开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度最高。(InnoDB存储引擎,行锁支持事务)
案例见下面的第二章节。
3. 事务
事务是由一组SQL语句组成的逻辑处理单元,事务具有以下4个属性,通常简称为事务的ACID属性 。
原子性(Atomicity) :事务是一个原子操作单元,其对数据的修改,要么全都执行,要么全都不执行。
一致性(Consistent) :在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构(如B树索引或双向链表)也都必须是正确的。
隔离性(Isolation) :数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的“独立”环境执行。这意味着事务处理过程中的中间状态对外部是不可见的,反之亦然。
持久性(Durable) :事务完成之后,它对于数据的修改是永久性的,即使出现系统故障也能够保持。
4. 并发事务带来的问题
(1). 更新丢失(Lost Update)
当两个或多个事务选择同一行,然后基于最初选定的值更新该行时,由于每个事务都不知道其他事务的存在,就会发生丢失更新问题–最后的更新覆盖了由其他事务所做的更新。
(2). 脏读(Dirty Reads)
一个事务正在对一条记录做修改,在这个事务完成并提交前,这条记录的数据就处于不一致的状态;这时,另一个事务也来读取同一条记录,如果不加控制,第二个事务读取了这些“脏”数据,并据此作进一步的处理,就会产生未提交的数据依赖关系。这种现象被形象的叫做“脏读”。
一句话:事务A读取到了事务B已经修改但尚未提交的数据,还在这个数据基础上做了操作。此时,如果B事务回滚,A读取的数据无效,不符合一致性要求。
(3). 不可重复读(Non-Repeatable Reads)
一个事务内,在读取某些数据后的某个时间,再次读取以前读过的数据,却发现其读出的数据已经发生了改变、或某些记录已经被删除了!这种现象就叫做“不可重复读”。
一句话:事务A读取到了事务B已经提交的修改数据,不符合隔离性。
(4). 幻读(Phantom Reads)
一个事务在未结束按相同的查询条件重新读取以前检索过的数据,却发现其他事务插入了满足其查询条件的新数据,这种现象就称为“幻读”。
一句话:事务A读取到了事务B提交的新增数据,不符合隔离性.
总结:
脏读是指一个事务读取到了其他事务没有提交的数据,不可重复读是指一个事务内多次根据同一个查询条件查询出来的“同一行记录的值不一样”,幻读是指一个事务内多次 根据同个条件查出来的记录行数不一样。为了解决事务并发带来的问题,才有了事务规范中的四个事务隔离级别,不同隔离级别对上面问题部分或者全部做了避免。
5. 事务隔离级别
(1).读未提交(READ_UNCOMMITTED):读未提交,该隔离级别允许脏读取,其隔离级别是最低的。换句话说,如果一个事务正在处理某一数据,并对其进行了更新,但同时尚未完成事务, 因此还没有提交事务;而以此同时,允许另一个事务也能够访问该数据。
【引发的问题:脏读】
(2).读已提交(READ_COMMITTED) :事务执行的时候只能获取到其它事务已经提交的数据,获取不到未提交的数据。
【解决了“脏读”,但是解决不了“不可重复读”】
(3).可重复读(REPEATABLE_READ):保证在事务处理过程中,多次读取同一个数据时,该数据的值和事务开始时刻是一致的。
【解决了“脏读”和“不可重复度”,但是解决不了“幻读”】
(4).顺序读(可串行化)(SERIALIZABLE):最严格的事务隔离级别。它要求所有的事务排队顺序执行,即事务只能一个接一个地处理,不能并发。
【解决上述所有情况】
注:4 种事务隔离级别从上往下,级别越高,并发性越差,安全性就越来越高。一般数据默认级别是读已提交或可重复读。
PS:常见数据库的默认级别:
①:MySQL 数据库的默认隔离级别是 REPEATABLE_READ(可重复读) 级别。所以mysql中不会出现脏读、不可重复读,但是会出现幻读。
②:Oracle数据库中,只支持 SERIALIZABLE 和 READ_COMMITTED级别,默认的是 READ_COMMITTED 级别。
③:SQL Server 数据库中,默认的是 READ_COMMITTED(读已提交) 级别。
PS:MySQL下的指令:
①:查看事务隔离级别
show variables like 'tx_isolation';
②:设置事务隔离级别(仅仅针对当前会话有效)
set tx_isolation='REPEATABLE-READ';
二. 实战
1. 读锁和写锁
表和数据准备(这里使用MyISAM引擎下的表级别锁)
‐‐建表SQL CREATE TABLE `mylock` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `NAME` VARCHAR (20) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE = MyISAM DEFAULT CHARSET = utf8; ‐‐插入数据 INSERT INTO `mylock` (`id`, `NAME`) VALUES ('1', 'a'); INSERT INTO `mylock` (`id`, `NAME`) VALUES ('2', 'b'); INSERT INTO `mylock` (`id`, `NAME`) VALUES ('3', 'c'); INSERT INTO `mylock` (`id`, `NAME`) VALUES ('4', 'd');
案例1-读锁
(1). 在会话1中给mylock表添加读锁
lock table mylock read;
(2). 分别在会话1和会话2中进行数据查询,均可查询成功。
(3). 分别在会话1和会话2中进行插入或更新操作,会话1报错,会话2等待。
(4). 释放会话1的锁【unlock tables;】,会话2插入成功。
案例2-写锁
添加写锁的指令:
--写锁 lock table mylock write;
重复上述步骤,得出的结论:当前会话对该表的增删改查都没有问题,其他会话对该表的所有操作被阻塞。
总结:
MyISAM在执行查询语句(SELECT)前,会自动给涉及的所有表加读锁,在执行增删改操作前,会自动给涉及的表加写锁。
(1). 对MyISAM表的读操作(加读锁) ,不会阻寒其他进程对同一表的读请求,但会阻塞对同一表的写请求。只有当读锁释放后,才会执行其它进程的写操作。
(2). 对MylSAM表的写操作(加写锁) ,不会祖册当前进程,但会阻塞其他进程对同一表的读和写操作,只有当写锁释放后,才会执行其它进程的读写操作
简而言之,就是读锁会阻塞写,但是不会阻塞读。而写锁则会把读和写都阻塞。
补充查看锁的指令:
--查看锁(In_use为1代表有锁) show open tables;
2. 读未提交
数据准备(后面案例都基于这些数据)
--创建表 CREATE TABLE `account` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `name` VARCHAR (255) DEFAULT NULL, `balance` int(255) NULL DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE = InnoDB DEFAULT CHARSET = utf8; --清空表数据 truncate table `account`; --插入数据 INSERT INTO `IndexTestDB`.`account`(`name`, `balance`) VALUES ('lilei', 450); INSERT INTO `IndexTestDB`.`account`(`name`, `balance`) VALUES ('hanmei', 16000); INSERT INTO `IndexTestDB`.`account`(`name`, `balance`) VALUES ('lucy', 2400);
(1). 设置会话A的事务隔离级别为【读未提交】
set session transaction isolation level read uncommitted;
开启事务(begin),进行数据查询,如下图:
select * from account;
(2). 打开会话B,保持默认的事务隔离级别即可,开启事务(begin),执行一条更新操作,不提交事务。
update account set balance=balance-50 where id=1;
(3). 回到会话A,再次查询数据,发现读取到了事务B修改后的数据,但是事务B并没有提交,这就是脏读。
剖析:在实际应用程序中,我们会拿着400去做业务处理,即使会话B事务回滚了,应用程序也不知道。
3. 读已提交
(1). 设置会话A的事务隔离级别为【读已提交】 ,开启事务(begin),进行数据查询。
set session transaction isolation level read committed;
(2). 打开会话B,保持默认的事务隔离级别即可,开启事务(begin),执行一条更新操作,不提交事务。
(3). 回到会话A,进行数据查询,发现查询的结果是450,而不是400,说明会话A并没有读取会话B事务没有提交的数据,解决了脏读问题。
(4). 回到会话B,进行事务提交(commit)。
(5). 回到会话A,继续进行数据查询,发现查出来的数据是400,在同一个事务中,事务还没有结束,同样的语句查出来不同的结果值,这就是不可重复读。
4. 可重复读
(1). 设置会话A的事务隔离级别为【读已提交】 ,开启事务,进行数据查询。(或者不做任何设置,mysql的默认事务隔离级别就是读已提交)
set session transaction isolation level repeatable read;
(2). 打开会话B,开启事务,更新数据,并且事务提交。
(3). 回到会话A,进行数据查询,发现查出来的结果是450,两次查询结果一致,解决了不可重复读问题。
(4). 在会话A中执行更新操作,发现结果是350,而不是400,数据的一致性倒是没有被破坏,这就是MVCC机制。
可重复读的隔离级别下使用了MVCC(multi-version concurrency control)机制,select操作不会更新版本号,是快照读(历史版本);insert、update和delete会更新版本号,是当前读(当前版本)。
下面开始验证幻读:
(5). 重新打开会话B,开启事务,插入一条id=3的数据,提交事务。
(6). 回到会话A,进行数据查询,仍然是两条数据,并没有出现幻读。
(7). 在会话A中执行对 id=3的数据的更新操作。然后进行数据查询,出现了3条数据,即多了一条id=3的数据,这就是幻读。
注:上述6中查不出来数据,7中更新一下查出来数据,结合下面的MVCC详解来理解这个现象。
5. 串行化
(1). 设置会话A的事务隔离级别为【串行化】 ,开启事务,进行数据查询。
set session transaction isolation level serializable;
(2). 打开会话B,设置隔离级别为【串行化】,开启事务,进行数据插入操作,发现并不能插入,一直在等待,从而解决了幻读问题。(这种级别非常少用)
6. 行锁
会话A开启事务更新id=1的数据,不提交;会话B开启事务,更新id=1的数据会被阻塞,更新其他数据没问题。
PS:以前理解的脏读是不准确的,那只是并发导致的一个bug,可以认为他是更新丢失。
三. MVCC机制
1. 业务准备
开启3个事务操作accout表,然后开启两个事务进行select查询操作,如下图:
2. MVCC底层剖析
(1). 底部版本链记录 和 原理分析
(2). 分析查询事务Select1
A. 步骤(5),未提交的事务id为100和200,已经提交的事务id为300,所以生成的readview为 [100,200],300,从上往下分析版本链,
① 步骤(3) trx_id=300,300属于右上图橙色范畴,且不在trx_id 的数组中,所以表示该行记录是已经提交的的事务生成的,数据是可见的,所以name=ypf300.
B. 步骤(8),同一个事务中readview是不变的,所以 readview为 [100,200],300,从上往下分析版本链:
① 步骤(7), trx_id=100,100在readview的数组中,表示该行记录是由还没有提交的事务生成的,所以不可见。
② 步骤(6), 同步骤(7), 数据不可见
③ 步骤(3), 上面的A中已经分析过,数据可见,所以name=ypf300
C. 步骤(12), 同一个事务中readview是不变的,所以 readview为 [100,200],300,从上往下分析版本链:
① 步骤(11), trx_id=200,200在readview的数组中,表示该行记录是由还没有提交的事务生成的,所以不可见。
② 步骤(10), 同步骤(11), 数据不可见
① 步骤(7), trx_id=100,100在readview的数组中,表示该行记录是由还没有提交的事务生成的,所以不可见。
② 步骤(6), 同步骤(7), 数据不可见
③ 步骤(3), 上面的A中已经分析过,数据可见,所以name=ypf300
(3). 分析查询事务Select12
步骤(13),未提交的事务id为200,已经提交的事务id为300,所以生成的readview为 [200],300,从上往下分析版本链,
① 步骤(11), trx_id=200, 200在readview的数组中,表示该行记录是由还没有提交的事务生成的,所以不可见。
② 步骤(10), 同步骤(11), 数据不可见
① 步骤(7), trx_id=100,100<200,属于右上图绿色范畴,表示该行记录是由已经提交的事务生成的,是可见的,所有name=ypf2。
四. 其它补充
1. 间隙锁
间隙锁在某些情况下可以解决幻读问题。
要避免幻读可以用间隙锁在会话A下面执行,则其他会话没法在这个范围所包含的间隙里插入或修改任何数据。
update account set name ='zhuge' where id > 10 and id <=20;,
2. 行锁升级表锁
(1). 锁主要是加在索引上,如果对非索引字段更新, 行锁可能会变表锁
会话A执行:
update account set balance = 800 where name = 'lilei';
(2). 会话B对该表任一行操作都会阻塞住
InnoDB的行锁是针对索引加的锁,不是针对记录加的锁。并且该索引不能失效,否则都会从行锁升级为表锁。
锁定某一行还可以用lock in share mode(共享锁) 和for update(排它锁),例如:select * from test_innodb_lock where a = 2 for update; 这样其他session只能读这行数据,修改则会被阻塞,直到锁定行的session提交。
补充:行锁分析
show status like'innodb_row_lock%';
对各个状态量的说明如下:
Innodb_row_lock_current_waits: 当前正在等待锁定的数量
Innodb_row_lock_time: 从系统启动到现在锁定总时间长度
Innodb_row_lock_time_avg: 每次等待所花平均时间
Innodb_row_lock_time_max:从系统启动到现在等待最长的一次所花时间
Innodb_row_lock_waits:系统启动后到现在总共等待的次数
对于这5个状态变量,比较重要的主要是:
Innodb_row_lock_time_avg (等待平均时长)
Innodb_row_lock_waits (等待总次数)
Innodb_row_lock_time(等待总时长)
尤其是当等待次数很高,而且每次等待时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手制定优化计划。
3. 死锁
会话A执行: select * from account where id=1 for update; 会话B执行: select * from account where id=2 for update; 会话A执行: select * from account where id=2 for update; 会话B执行: select * from account where id=1 for update;
PS:大多数情况mysql可以自动检测死锁并回滚产生死锁的那个事务,但是有些情况mysql没法自动检测死锁
4. 优化建议
(1). 尽可能让所有数据检索都通过索引来完成,避免无索引行锁升级为表锁
(2). 合理设计索引,尽量缩小锁的范围
(3). 尽可能减少检索条件范围,避免间隙锁
(4). 尽量控制事务大小,减少锁定资源量和时间长度,涉及事务加锁的sql
(5). 尽量放在事务最后执行
(6). 尽可能低级别事务隔离
!
- 作 者 : Yaopengfei(姚鹏飞)
- 博客地址 : http://www.cnblogs.com/yaopengfei/
- 声 明1 : 如有错误,欢迎讨论,请勿谩骂^_^。
- 声 明2 : 原创博客请在转载时保留原文链接或在文章开头加上本人博客地址,否则保留追究法律责任的权利。