事务与隔离级别
事务的基本特征 ACID
- Atomic(原子性):事务中所有的操作是一个整体单元,这个单元中的操作要么全部成功,要么全部失败,不会出现部分失败、部分成功的场景;
- Consistency(一致性):事务在完成时,必须使所有的数据都保持一致的状态(约束 a + b = 10,事务结束后 a + b = 10 仍然成立);
- Isolation(隔离性):各个事务在一定程度上感觉不到其他事务的存在(体现在不同的隔离级别上);
- Durability(持久性):事务提交后,所有的数据都会永久写入到磁盘。
事务的隔离级别
数据库标准提出了 4 类隔离级别,在不同程度上压制更新丢失。
- 读未提交
- 读已提交
- 可重复读
- 串行化
读未提交
读未提交(read uncommitted) 是最低的隔离级别,允许一个事务读取另一个事务没有提交的数据。适合对于数据一致性没有要求的场景。它存在脏读的现象,如下表:
时刻 | 事务 1 | 事务 2 | 说明 |
---|---|---|---|
T1 | 读取库存为 2 | 库存为 2 | |
T2 | 库存 - 1 | 库存为 1 | |
T3 | 库存 - 1 | 库存为 0(读取到事务 1 没有提交的数据) | |
T4 | 提交事务 | 库存保存为 0 | |
T5 | 回滚 | 库存为 0(第一类丢失更新已经克服) |
第一类丢失更新:一个事务回滚,另一个事务提交,回滚覆盖了提交的数据。目前的数据库都克服了第一类丢失更新。
读已提交
读已提交(read committed) 是指一个事务只能读取另一个事务已提交的数据,不能读取未提交的数据。
时刻 | 事务 1 | 事务 2 | 说明 |
---|---|---|---|
T1 | 读取库存为 2 | 库存为 2 | |
T2 | 库存 - 1 | 事务 1 中库存为 1 | |
T3 | 库存 - 1 | 事务 2 中库存为 1(事务 1 未提交) | |
T4 | 提交 | 库存保存为 1 | |
T5 | 回滚事务 | 库存为 1 (第一类丢失更新已经克服) |
上表中的操作结果最终正确。但是读已提交会产生不可重复读:
时刻 | 事务 1 | 事务 2 | 说明 |
---|---|---|---|
T1 | 读取库存为 1 | 库存为 1 | |
T2 | 库存 - 1 | 事务 1 中库存为 0 | |
T3 | 读取库存为 1 | 事务 2 认为可以扣减(事务 1 未提交) | |
T4 | 提交 | 库存保存为 0 | |
T5 | 库存 - 1 | 失败,此时库存为 0 |
这里事务 2 在事务 1 提交之前认为可以扣减,而后来事务 2 扣减时发现库存已经为 0 无法扣减,这样的现象称为不可重复读,这就是读已提交的一个不足。
可重复读
可重复读(read repeatable) 的目标是克服读已提交中出现的不可重复读的现象。
时刻 | 事务 1 | 事务 2 | 说明 |
---|---|---|---|
T1 | 读取库存为 1 | 库存为 1 | |
T2 | 库存 - 1 | 事务 1 中库存为 0 | |
T3 | 读取库存 | 事务 2 不能读取,等待事务 1 提交 | |
T4 | 提交 | 库存保存为 0 | |
T5 | 读取库存 | 库存为 0,无法扣减 |
当事务 2 读取事务 1 事先读取的数据时,会被阻塞,直到事务 1 提交后事务 2 才能读取,读已提交中出现的不可重复读现象消失了。但是可重复读会出现幻读:
时刻 | 事务 1 | 事务 2 | 说明 |
---|---|---|---|
T1 | 查询库存 100 | 库存 100,10 个订单 | |
T2 | 查询订单为 10 | ||
T3 | 库存 - 1 | ||
T4 | 插入订单 | ||
T5 | 提交 | 库存 99,11 个订单 | |
T6 | 打印订单,11 单 | 事务 2 中多了一条记录,与之前查询的不一致 |
上表出现的就是幻读现象,幻读不是针对一条数据库记录而言,而是多条记录,上表中订单是多条记录统计出来的,它会产生幻读。
串行化
串行化(serializable) 是数据库最高的隔离级别,所有的事务都按顺序执行。它可以克服前面的隔离级别中出现的各种问题,能够完全保证数据的一致性。
总结
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
读未提交 | √ | √ | √ |
读已提交 | × | √ | √ |
可重复读 | × | × | √ |
串行化 | × | × | × |
不同的隔离级别能够在不同程度上压制丢失更新,使用更高的隔离级别能够更好地保证数据的一致性,但是也要付出性能的代价。隔离级别越高,性能越是直线地下降。