-
事务就是要保证一组数据库的操作,要么全部成功,要么全部失败。
MySQL中,事务支持实在引擎层实现的。MyISAM引擎就不支持事务,所以被InnodDB取代了。
-
事务的几个特性:ACID
-
Atomicity,原子性
-
Consistency,一致性
-
Isolation,隔离性
-
Durability,持久性
-
隔离性与隔离级别
-
当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题。
-
隔离的越严实,效率就越低
-
SQL标准的事务隔离级别包括:
读未提交(read uncommitted)
读提交(read committed)
可重复度(repeatable read)
串行化(serializable)
-
读未提交是指,一个事务还没提交时,它做的变更就能被别的事务看到。
-
读提交是指,一个事务提交之后,它做的变更才会被其他事务看到。
-
可重复度是指,一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
-
串行化,对同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等待前一个事务执行完成,才能继续执行。
-
用过一个例子说明这几种隔离级别,
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
-
下面是按照时间顺序执行两个事务的行为。
-
不同的隔离级别下,事务A会有哪些不同的返回结果
-
视图
在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。
在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都在用这个视图;
在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的;
在“读未提交”隔离级别下直接返回记录上的最新值,没有视图的概念;
在“串行化”隔离级别下直接用加锁的方式来避免并行访问。
-
Oracle数据库的默认隔离级别就是“读提交”
-
配置方式:
将启动参数 transaction-isolation 的值设置成 READ-COMMITTED。你可以用 show variables 来查看当前的值。
mysql> show variables like 'transaction_isolation';
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+
-
"可重复读“的场景,看一个数据校对逻辑的案例
假设你在管理一个个人银行账户表。一个表存了每个月月底的余额,一个表存了账单明细。这时候你要做数据校对,也就是判断上个月的余额和当前余额的差额,是否与本月的账单明细一致。你一定希望在校对过程中,即使有用户发生了一笔新的交易,也不影响你的校对结果。
-
事务隔离的实现,以”可重复读“展开说明
在MySQL中,实际上每条记录在更新的时候都会同时记录一条回滚操作。假设一个值从 1 被按顺序改成了 2、3、4,在回滚日志里面就会有类似下面的记录。
在查询这条记录的时候,不同时刻启动的事务会有不同的 read-view。如图中看到的,在视图 A、B、C 里面,这一个记录的值分别是 1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC)。对于 read-view A,要得到 1,就必须将当前值依次执行图中所有的回滚操作得到。
-
回滚日志的删除
当系统里没有比这个回滚日志更早的 read-view 的时候。这条回滚日志就会被删除。系统会判断,当没有事务再需要用到这些回滚日志时,回滚日志会被删除。
-
所以尽量不要使用长事务,在这个事务没有提交之前,数据库里面其他可能用到的回滚记录都必须保留,会导致占用大量内存。
-
长事务除了对回滚段的影响,长事务还占用锁资源,也可能拖垮整个库。
-
事务的启动方式
-
MySQL的事务启动方式:
建议总是使用set autocommit=1,通过显式语句的方式来启动事务。
-
对于一个需要频繁使用事务的业务,建议使用commit work and chain语法。
在autocommit为1的情况下,用begin显式启动的事务,如果执行commit则提交事务。如果执行commit work and chain,则是提交事务并自动启动下一个事务,这样也省去了再次执行begin语句的开销。好处是明确知道每个语句是否处于事务中。
-
在information_schema库的innodb_trx这个表中查询事务,比如下面这个语句,用于查找持续时间超过60s的事务。
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60
-
思考
-
回答这些问题检验自己掌握程度
1.
事务的概念是什么?
2.
mysql的事务隔离级别读未提交, 读已提交, 可重复读, 串行各是什么意思?
3.
读已提交, 可重复读是怎么通过视图构建实现的?
4.
可重复读的使用场景举例? 对账的时候应该很有用?
5.
事务隔离是怎么通过read-view(读视图)实现的?
6.
并发版本控制(MCVV)的概念是什么, 是怎么实现的?
7.
使用长事务的弊病? 为什么使用常事务可能拖垮整个库?
8.
事务的启动方式有哪几种?
9.
commit work and chain的语法是做什么用的?
10.
怎么查询各个表中的长事务?
11.
如何避免长事务的出现?
-
MySQL中undo的内容会被记录到redo中吗?比如一个事务在执行到一半的时候实例崩溃了,在恢复的时候是不是先恢复redo,再根据redo构造undo回滚宕机前没有提交的事务。
-
首先,从应用开发端来看看
1、确认是否使用了set autocommit=0。确认工作可以再测试环境中开展,把MySQL的general_log开起来,然后随便跑一个业务逻辑,通过general_log的日志来确认。如果设为0,我们就把它改成1.
2、确认是否有不必要的读事务。
3、业务连接数据库的时候,根据业务本身的预估,通过SET MAX_EXECUTION_TIME 命令,来控制每个语句执行的最长时间,避免单个语句执行太长。
-
其次,从数据库端来看
1、监控information_schema.Innodb_trx表,设置长事务伐值,超过就报警/或者kill;
2、Percona的pt-kill这个工具不错,推荐使用。
3、在业务功能测试阶段要求输出所有的general_log,分析日志提前发现问题;
4、如果使用的是MySQL5.6或者更新的版本,把innodb_undo_tablespaces设成2(或者更大的值)。如果真的出现大事务导致回滚段过大,这样设置清理起来更方便。