数据库相关知识

为了更好的理解@Transactional的内容,讨论一些数据库的特性

1.数据库事务ACID特性

           数据库事务正确执行的四个基础要素是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。

  • 原子性:是指事务包含的所有操作要么全部成功,要么全部失败回滚,不可能停滞在中间某个环节。事务在执行过程中发生错误,会被回滚到事务开始前的状态,就像这个事务从来没有被执行过一样。
  • 一致性:是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。

      拿转账来说,假设用户A和用户B两者的钱加起来一共是5000,那么不管A和B之间如何转账,转几次账,事务结束后两个用户的钱相加起来应该还得是5000,这就是事务的一致性。

  • 隔离性:两个事务之间的隔离程度

  • 持久性

      持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作。

2 丢失更新

       在互联网中存在着抢购、秒杀等高并发环境,使得数据库在一个多事务的环境中运行,多个事务的并发会产生一系列的问题,主要的问题之一就是丢失更新,一般而言存在两类丢失更新。

       假设一个场景,一个账户存在互联网消费和刷卡消费两种形式,而一对夫妻共用这个账户。老公喜欢刷卡消费,老婆喜欢互联网消费,那么可能产生如下表所示场景

表1   第一类丢失更新

时间

事务一(老公)

事务二(老婆)

T1

查询账户余额为10000元   

 

T2

   

 查询账户余额为10000元   

T3

 

 网购1000元

T4

请客吃饭消费1000元 

 

T5

提交事务成功,余额9000元 

 

T6

 

取消购买,回滚事务到T2时刻,余额10000元

      整个过程只有老公消费1000元,而在最后的T6时刻,老婆回滚事务,却恢复了原来的初始值10000元,这显然不符合事实。这样的两个事务并发,一个回滚、一个提交成功导致不一致,称之为第一类丢失更新。大部分数据库(包括Mysql和Oracle)基本都已经消灭了这类丢失更新。

       第二类丢失更新是我们真正需要关注的内容,还是上面的例子,如表2所示

表2   第二类丢失更新

时间

事务一(老公)

事务二(老婆)

T1

查询账户余额为10000元   

 

T2

   

 查询账户余额为10000元   

T3

 

 网购1000元

T4

请客吃饭消费1000元 

 

T5

提交事务成功,余额9000元 

 

T6

 

提交事务,根据之前余额10000元,扣减1000元后,余额为9000元

      整个过程存在两笔交易,一笔是老公的请客吃饭,一笔是老婆的网购,两者都提交了事务,由于在不同的事务中,无法探知其它事务的操作,导致两者提交后,余额都为9000元,而实际正确的应为8000元,这就是第二类丢失更新。为了克服事务之间协助的一致性,数据库标准规范中定义了事务之间的隔离级别,来在不同程度上减少出现丢失更新的可能性---->数据库隔离级别。

 隔离级别

        隔离级别可以在不同程度上减少丢失更新,按照SQL的标准规范,把隔离级别定义为4层,分别是:脏读(dirty read)、读/写提交(read commit)、可重复读(repeatable read)和序列化(serializable)。

       脏读是最低的隔离级别,允许一个事务去读取另一个事务中未提交的数据。

表3   脏读

时间

事务一(老公)

事务二(老婆)

备注

T1

查询余额10000元   

 

 

T2

   

 查询余额10000元   

 

T3

 

 网购1000元,余额9000元

 

T4

请客吃饭消费1000元,余额8000元 

 

读取到事务二,未提交余额为9000元,所以余额为8000元

T5

提交事务

 

余额为8000元

T6

 

回滚事务

由于第一类丢失更新已经克服,所以余额为错误的8000元

      由于在T3时刻老婆启动了消费,导致余额为9000元,老公在T4时刻消费,因为用了脏读,所以能够读取老婆消费的余额(事务二未提交的)为9000元,这样余额就为8000元了,于是T5时刻老公提价事务,余额变为了8000元,老婆在T6时刻回滚事务,由于第一类丢失更新已经克服,所以余额为错误的8000元,显然这是一个错误的余额,产生这个错误的根源来自于T4时刻,也就是事务一读取到事务二未提交的事务,这样的场景称之为脏读。

     为了克服脏读,SQL标准提出了第二个隔离级别----读/写提交。所谓读写提交,就是说一个事务只能读取另一个事务已经提交的数据。

表4   读/写提交

时间

事务一(老公)

事务二(老婆)

备注

T1

查询余额10000元   

 

 

T2

   

 查询余额10000元   

 

T3

 

 网购1000元,余额9000元

 

T4

请客吃饭消费1000元,余额9000元 

 

由于事务二的余额未提交,采取读/写提交时不能读出,所以余额为9000元

T5

提交事务

 

余额为9000元

T6

 

回滚事务

由于第一类丢失更新已经克服,所以余额依旧为正确的9000元

      在T3时刻由于事务采取读/写提交的隔离级别,所以老公无法读取老婆未提交的9000元余额,他只能读取到10000元,所以在消费后余额依旧为9000元。T5时刻提交事务,而T6时刻老婆回滚事务,所以结果为正确的9000元,这样就消除了脏读带来的问题,但是也会引发其它问题,如下表所示。

表5  不可重复读

时间

事务一(老公)

事务二(老婆)

备注

T1

查询余额10000元   

 

 

T2

   

 查询余额10000元   

 

T3

 

 网购1000元,余额9000元

 

T4

请客吃饭消费2000元,余额8000元 

 

由于采取读/写提交,不能读取事务二中未提交的余额9000元

T5

 

继续购物8000元,余额1000元

由于采取读/写提交,不能读取事务一中未提交的余额8000元

T6

 

提交事务,余额1000元

老婆提交事务,余额更新为1000元

T7

提交事务发现余额为1000元,不足以买单  

由于采取读/写提交,因此此时事务一可以知道余额不足

      由于T7时刻事务一知道事务二提交的结果----余额为1000元,导致老公无钱买单的尴尬。对于老公而言,他并不知道老婆做了什么事情,但是账户余额却莫名其妙地从10000元变为了1000元,对他来说,账户余额是不能重复读取的,而是一个会变化的值,这样的场景称之为不可重复读(unrepeatable read),这是读/写提交存在的问题。

       为了克服不可重复读带来的错误,SQL标准又提出了一个可重复读的隔离级别来解决问题。注意,可重复读针对的是数据库同一条记录而言的,换句话说,可重复读会使得同一条记录的读/写按照一个序列化进行操作,不会产生交叉情况,这样就能保证同一条数据的一致性,进而保证上述场景的正确性。但是由于数据库并不是只能针对一条数据进行读/写操作,在很多场景,数据库需要同时对多条记录进行读/写,这个时候会产生下面的情况。如下表所示

表6  幻读

时间

事务一(老公)

事务二(老婆)

备注

T1

 

 查询消费记录为10条,准备打印

初始状态

T2

启用消费一笔   

 

 

T3

提价事务 

 

 

T4

 

打印消费记录得到11条

老婆发现打印了11条消费记录,比查询的10条多了一条。她会认为这条是多余不存在的,这样的场景称之为幻读。

       老婆在T1查询得到10条记录,到T4打印记录时,并不知道老公在T2和T3时刻进行了消费,导致多一条(可重复读针对的是同一条记录,而这里不是同一条记录)消费记录的产生,她会质疑这条多出来的记录是不是幻读出来的,这样的场景称之为幻读

      为了克服幻读,SQL标准又提出了序列化的隔离级别。它是一种让SQL按照顺序读/写的方式,能够消除数据库事务之间并发产生数据不一致的问题。

表7  各类隔离级别和产生的现象

隔离级别

脏读

不可重复读

幻读

脏读

 √

 √

 √

读/写提交

 ×

 √ 

 √

可重复读

 ×

 ×

 √

序列化

 ×

 ×

 ×

posted @ 2022-06-12 16:05  Tiger-Adan  阅读(212)  评论(0编辑  收藏  举报