mysql系列03---事务
一、事务简介
事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销
操作请求,即这些操作要么同时成功,要么同时失败。
二、事物的四大特性
一个事务具有ACID
特性,也就是(Atomicity、Consistency、Isolation、Durability,即原子性
、一致性
、隔离性
、持久性
)
原子性(Atomicity):指事务是一个不可分割的最小工作单位,事务中的操作只有都发生和都不发生两种情况
一致性(Consistency):事务必须使数据库从一个一致状态变换到另外一个一致状态,举一个栗子,李二给王五转账50元,其事务就是让李二账户上减去50元,王五账户上加上50元;一致性是指其他事务看到的情况是要么李二还没有给王五转账的状态,要么王五已经成功接收到李二的50元转账。而对于李二少了50元,王五还没加上50元这个中间状态是不可见的。
隔离性(Isolation):一个事务的执行不能被其他事务干扰,即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
持久性(Durability):一个事务一旦提交成功,它对数据库中数据的改变将是永久性的,接下来的其他操作或故障不应对其有任何影响。
三、事物的隔离级别(Isolation)
-
读未提交(read uncommitted)
-
一个事务还没提交时,它修改的数据都可以被别的事物看到。
-
读已提交(read committed)
-
一个事务提交之后,它修改的数据才会被别的事物看到。
-
可重复读(repeatable read)
-
一个事务执行过程中看到的数据,总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下,未提交的事务对其他事务也是不可见的。
-
串行化(serializable)
-
数据的
读
和写
都会加锁
,读
会加读锁
,写
会加写锁
。当遇到读写锁冲突时,后访问的事务必须等前一个事务执行完成后,再继续执行。
以上四种隔离级别,由上往下隔离强度越来越大,但是执行效率会随之降低。在设置隔离级别时候,需要在隔离级别
和执行效率
两者做平衡取舍。
1、事物隔离级别举例:
请问,在不同的隔离级别下X1、X2、X3值分别是多少?
假装思考3分钟。。。。。。。。
正确答案:
-
如果隔离级别是读未提交,
事务B
修改后数据无需提交事务,就能被事务A
读取,所以V1
、V2
、V3
的值都是2
。 -
如果隔离级别是读已提交,
事务B
修改后需要提交后,修改后的数据才能被事务A
读取,所以V1
的值是1
,事务B
提交,事务A
读取修改后的数据,所以V2
的值是2
,V3
的值也是2
。 -
如果隔离级别是可重复读,整个事务看到的事务和事务开启时看到的数据是一致的,开启看到的数据是
1
,所以V1
、V2
的值都是1
,事务A提交之后,获取到修改后的数据,所以V3
的值是2
。 -
如果隔离级别是串行化,会被锁住,此时事务B对应的线程处于阻塞状态,直到事务A提交之后,事务B才会继续
将1改成2
。所以V1
、V2
的值是1
,V3
的值是2
。
MySQL
默认的隔离级别是可重复读
。
2、不同隔离级别存在的问题:
先了解几个基本概念:
脏读:事务A
修改数据,事务B
读取了数据后事务A
报错回滚,修改的数据没有提交到数据库中,此时事务B
读取修改的数据就是一个脏读,也就是一个事务读取到另一个事务未提交的数据就是脏读。
不可重复读:事务A
在同一个事务上多次读取同一个数据,在事务A
还没有结束时,事务B
修改了该数据,由于事务B
的修改,导致事务A
两次读取的数据不一致,就出现了不可以重复读的现象。
幻读:事务A
根据条件查询得到N
条数据,但此时事务B
更改或者增加了M
条符合事务A
查询的条件的数据。这样当事务A
再次查询的时候发现会有N + M
条数据,产生了幻读。
存在的问题:
-
读未提交
:
可能会出现脏读
、不可重复读
、幻读
,读取未提交事务的数据,数据撤回了,就是一种脏读
。如果其他事务修改同一个数据,事务读取的数据也是不同的,所以也存在不可重复读
。同时也能读取到其他事务添加的数据,所以也存在幻读
。
-
读已提交
:
该隔离级别只能读取到其他事务提交后的数据,所以不存在脏读
。但是在第一次读取数据后,其他事务修改后数据并提交事务,此时事务读取到数据就和第一次读到的数据不一致了,也就存在不可重复读
。同时其他事务可以添加多条数据,也存在幻读
。
-
可重复度读
:
表示整个事务看到的事务和开启后的事务能看到的数据是一致的,既然数据是一致的,所以不存在不可重复读
。而且不会读取其他事务修改的数据,也就是不存在脏读
。而对同一个批
数据,可能会存在添加的情况,所以可能会存在幻读的情况。
-
窜行化
:
当发生读写锁冲突时,后面的事务要等前面的事务执行完毕之后再执行,所以一定是先读或者先写的执行完毕之后再执行后读或者写,读写按照顺序依次进行,所以不存在脏读
、不存在不可重复读
、也不存在幻读
。
3、隔离级别的原理
隔离级别的主要是多版本并发控制MVCC
,MVCC
是通过保存数据在某个时间点的快照来实现的。
InnoDB
实现的MVCC
,是通过在每行记录后面保存两个隐藏列来实现,一个是保存行的创建时间,另一个是保存行的过期时间。当然存储的不是时间,而是系统版本号
。每开启一个新的事务,系统版本号先自动递增,该系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号做比较。比如在可重复读
隔离级别下,MVCC
是如何操作的:
-
SELECT
-
InnoDB
会根据以下两个条件检查每行记录: -
只有符合上述两个条件的记录,才能返回作为查询的结果。
-
InnoDB
只查找版本号早于当前事务的数据行(系统版本号小于或者等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前就存在,要么是事务自身插入或者更新过。 -
行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
-
INSERT
-
InnoDB
为新插入的每一行保存当前系统版本号作为行版本号。 -
DELETE
-
InnoDB
为删除的每一行保存当前系统版本号作为行删除的标识。 -
UPDATE
-
InnoDB
为插入一行新记录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。
保存着两个额外的系统版本号,大多数读操作都可以不用加锁
。这样设计是的读数据的操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额外的维护工作。
MVCC
只在读已提交
和可重复读
两个隔离级别下生效。其他两个隔离级别下MVCC都不能生效,因为读未提交
总是读取到最新的数据行,无需记录当前事务版本号。而串行化
会对所有的读写都会进行加锁,先读、先写
的先执行,后读
、后写
的后执行。也不需要记录记录版本号精心比对。
InnoDB
的行数据有多个版本,每个数据版本都有自己的row trx_id
,每个事务或者语句都有自己的一致性视图。查询语句是一致性读,一致性读会根据row trx_id
和一致性视图确定数据版本的可见性。
-
可重复读,只查询在事务启动前就提交完成的数据。
-
读已提交,只查询语句启动前其他事务提交的数据。