数据库的操作通常为写和读,就是所说的CRUD:增加(Create)、读取(Read)、更新(Update)和删除(Delete)。
事务就是一件完整要做的事情。
事务是恢复和并发控制的基本单位。
事务必须始终保持系统处于一致的状态,不管在任何给定的时间并发事务有多少。
事务在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序。是数据库中各种数据项的一个程序执行单元。
事务是用户定义的一个操作序列(多个表同时读写)。这些操作要么都做,要么都不做,是一个不可分割的工作单位。
事务通常是以BEGIN TRANSACTION开始,以COMMIT或ROLLBACK结束。
COMMIT:表示事务完成提交,即提交事务的所有操作,具体地说就是将事务中所有对数据库的更新写回到磁盘上的物理数据库中去,事务正常结束。
ROLLBACK:表示事务的回滚,即在事务运行的过程中发生了某种故障,事务不能继续进行,系统将事务中对数据库的所有以完成的操作全部撤消,滚回到事务开始的状态或设置的回滚点。
事务具有的特性ACID:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。
原子性(Atomicity):事务是数据库的逻辑工作单位,事务中包括的诸操作要么全做【全部成功】,要么全不做【全部失败】。
一致性(Consistency):事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态,一致性与原子性是密切相关的。
隔离性(Isolation):一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
持续性/永久性(Durability):一个事务一旦提交,它对数据库中数据的改变就应该是永久性的,其他操作或故障不应该对其有任何影响。
事物的隔离级别:
SQL的标准定义了4个隔离级别,设定一定的规则,限定事务内部的那些改变是可见的,那些是不可见的。低级别的事务一般会支持更高的并发处理,涉及更低的系统开销。
Read Uncommitted【读未提交数据】:允许所有事务读取未被其他事务提交的数据修改。会导致脏读、不可重复读和幻读的问题的出现。
Read Committed【读已提交数据】:只允许事务读取已经被其他事务提交的数据修改。Oracle和sql server默认的级别,可以避免脏读,但不可重复读和幻读问题仍然会出现。
Repeatable Read【可重读】:是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。但幻读问题未解除。
Serializable【可串行化】:最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。
隔离级别各个问题:
这四种隔离级别采取不同的锁类型来实现,若读取的是同一个数据的话,就容易发生问题。
脏读【Drity Read】:A和B两个事务,A事务更新一份数据,未提交事物,B事务在此时读取了A的更新的数据,由于某些原因,A事务RollBack回滚了事务操作,则B事务所读取的A更新的数据就会是无效的临时的不正确的数据。
不可重复读【Non-repeatable read】:是指在一个事务内,多次读同一数据。A和B两个事务,A事务读取但A事务还没有结束时,B事务也访问修改了该同一数据并提交了事务。A事务再次读取,则两次读数据之间,由于B事务的修改,那么A事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。
避免“不可重复读”,通常可以用repeatable read 来设置隔离级别,这样事务A两次读取表中的数据时,事务B如果企图更改此表中的数据时,就会被阻塞,直到事务A提交,这样就保证了,事务A两次读取的数据的一致性。
事务A要两次读取表的中数据,虽然可以设置repeatable read防止事务B对数据进行修改,但是事务B却可以向表中插入新的数据,产生幻读。
幻读【Phantom Read】:是指当事务不是独立执“行数据”操作时发生的一种现象,A和B两个事务,A事务对表中的数据进行了修改,此修改涉及到全部的数据行,同时B事务也对此表中的数据进行了修改,此修改向表中插入了新的行。后操作A事物发现表中还有没有被修改的行,好像发生了幻觉一样。
InnoDB和Falcon[已淘汰]存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。
避免“幻读”,设置最高的事务隔离级别serializable,事务B就只能等待事务A的提交,才能想表中插入新的数据,从而避免了幻读。
数据库系统必须具有隔离并发运行各个事务的能力, 使它们不会相互影响, 避免各种并发问题.一个事务与其他事务隔离的程度称为隔离级别. 数据库规定了多种事务隔离级别, 不同隔离级别对应不同的干扰程度, 隔离级别越高, 数据一致性就越好, 但并发性越弱。
下图为数据库各隔离级别涉及的问题:Yes为存在问题,No反之不存在事务并发冲突问题:
丢失更新1:A和B两个事务,事物A先查询数据为15,后B事物对此数据进行了加5,则数据变为20,提交B事务,后A对此数据进行减5,修改此数据为10,某些原因A事务回滚数据则回到了15。丢失了B的更新。
丢失更新2:A和B两个事务,事物A先查询数据为15,后B事物对数据进行减5,数据修改为10,提交B事务,后A对其进行对数据进行加5,修改数据为20,提交事务A,最终此数据为20。丢失了B的更新。