MySQL事务隔离

  • 事务就是要保证一组数据库的操作,要么全部成功,要么全部失败。
    MySQL中,事务支持实在引擎层实现的。MyISAM引擎就不支持事务,所以被InnodDB取代了。
  • 事务的几个特性:ACID
    • Atomicity,原子性
    • Consistency,一致性
    • Isolation,隔离性
    • Durability,持久性
  • 隔离性与隔离级别
    • 当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题。
    • 隔离的越严实,效率就越低
    • SQL标准的事务隔离级别包括:
      读未提交(read uncommitted)
      读提交(read committed)
      可重复度(repeatable read)
      串行化(serializable)
    • 读未提交是指,一个事务还没提交时,它做的变更就能被别的事务看到。
    • 读提交是指,一个事务提交之后,它做的变更才会被其他事务看到。
    • 可重复度是指,一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
    • 串行化,对同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等待前一个事务执行完成,才能继续执行。
  • 用过一个例子说明这几种隔离级别,
    mysql> create table T(c int) engine=InnoDB;
    insert into T(c) values(1);
    • 下面是按照时间顺序执行两个事务的行为。
    • 不同的隔离级别下,事务A会有哪些不同的返回结果
      • 若隔离级别是“读未提交”
        V1、V2、V3都是2
      • 若隔离级别是“读提交”
        V1是1,V2、V3是2
      • 若隔离级别是“可重复读”
        V1、V2是1,V3是2
      • 若隔离级别是“串行化”
        事务B执行“将1改成2”的时候,会被锁住。直到事务A提交后,事务B才可以继续执行。从A的角度看,V1、V2值是1,V3是2。
  • 视图
    在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。
    在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都在用这个视图;
    在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的;
    在“读未提交”隔离级别下直接返回记录上的最新值,没有视图的概念;
    在“串行化”隔离级别下直接用加锁的方式来避免并行访问。
  • Oracle数据库的默认隔离级别就是“读提交”
  • 配置方式:
    将启动参数 transaction-isolation 的值设置成 READ-COMMITTED。你可以用 show variables 来查看当前的值。
    mysql> show variables like 'transaction_isolation';
    +-----------------------+----------------+
    | Variable_name | Value |
    +-----------------------+----------------+
    | transaction_isolation | READ-COMMITTED |
    +-----------------------+----------------+
  • "可重复读“的场景,看一个数据校对逻辑的案例
    假设你在管理一个个人银行账户表。一个表存了每个月月底的余额,一个表存了账单明细。这时候你要做数据校对,也就是判断上个月的余额和当前余额的差额,是否与本月的账单明细一致。你一定希望在校对过程中,即使有用户发生了一笔新的交易,也不影响你的校对结果。
  • 事务隔离的实现,以”可重复读“展开说明
    在MySQL中,实际上每条记录在更新的时候都会同时记录一条回滚操作。假设一个值从 1 被按顺序改成了 2、3、4,在回滚日志里面就会有类似下面的记录。
    在查询这条记录的时候,不同时刻启动的事务会有不同的 read-view。如图中看到的,在视图 A、B、C 里面,这一个记录的值分别是 1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC)。对于 read-view A,要得到 1,就必须将当前值依次执行图中所有的回滚操作得到。
    • 回滚日志的删除
      当系统里没有比这个回滚日志更早的 read-view 的时候。这条回滚日志就会被删除。系统会判断,当没有事务再需要用到这些回滚日志时,回滚日志会被删除。
    • 所以尽量不要使用长事务,在这个事务没有提交之前,数据库里面其他可能用到的回滚记录都必须保留,会导致占用大量内存。
    • 长事务除了对回滚段的影响,长事务还占用锁资源,也可能拖垮整个库。
  • 事务的启动方式
    • MySQL的事务启动方式:
      建议总是使用set autocommit=1,通过显式语句的方式来启动事务。
      • 显示启动事务语句,begin或start transaction。配套的提交语句是 commit,回滚语句是 rollback。
      • Set autocommit=0,这个命令会将这个线程的自动提交关掉。意味着如果你只执行一个 select 语句,这个事务就启动了,而且并不会自动提交。这个事务持续存在直到你主动执行 commit 或 rollback 语句,或者断开连接。
    • 对于一个需要频繁使用事务的业务,建议使用commit work and chain语法。
      在autocommit为1的情况下,用begin显式启动的事务,如果执行commit则提交事务。如果执行commit work and chain,则是提交事务并自动启动下一个事务,这样也省去了再次执行begin语句的开销。好处是明确知道每个语句是否处于事务中。
    • 在information_schema库的innodb_trx这个表中查询事务,比如下面这个语句,用于查找持续时间超过60s的事务。
      select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60
  • 思考
    • 如果你是业务开发负责人,你有什么方案避免长事务的出现或者如何处理这种情况?
  • 回答这些问题检验自己掌握程度
        1. 
    事务的概念是什么?
        2. 
    mysql的事务隔离级别读未提交, 读已提交, 可重复读, 串行各是什么意思?
        3. 
    读已提交, 可重复读是怎么通过视图构建实现的?
        4. 
    可重复读的使用场景举例? 对账的时候应该很有用?
        5. 
    事务隔离是怎么通过read-view(读视图)实现的?
        6. 
    并发版本控制(MCVV)的概念是什么, 是怎么实现的?
        7. 
    使用长事务的弊病? 为什么使用常事务可能拖垮整个库?
        8. 
    事务的启动方式有哪几种? 
        9. 
    commit work and chain的语法是做什么用的? 
        10. 
    怎么查询各个表中的长事务?
        11. 
    如何避免长事务的出现?
  • MySQL中undo的内容会被记录到redo中吗?比如一个事务在执行到一半的时候实例崩溃了,在恢复的时候是不是先恢复redo,再根据redo构造undo回滚宕机前没有提交的事务。
  • 首先,从应用开发端来看看
    1、确认是否使用了set autocommit=0。确认工作可以再测试环境中开展,把MySQL的general_log开起来,然后随便跑一个业务逻辑,通过general_log的日志来确认。如果设为0,我们就把它改成1.
    2、确认是否有不必要的读事务。
    3、业务连接数据库的时候,根据业务本身的预估,通过SET MAX_EXECUTION_TIME 命令,来控制每个语句执行的最长时间,避免单个语句执行太长。
  • 其次,从数据库端来看
    1、监控information_schema.Innodb_trx表,设置长事务伐值,超过就报警/或者kill;
    2、Percona的pt-kill这个工具不错,推荐使用。
    3、在业务功能测试阶段要求输出所有的general_log,分析日志提前发现问题;
    4、如果使用的是MySQL5.6或者更新的版本,把innodb_undo_tablespaces设成2(或者更大的值)。如果真的出现大事务导致回滚段过大,这样设置清理起来更方便。
 

posted on 2019-08-28 21:20  拾掇的往昔  阅读(304)  评论(0编辑  收藏  举报

导航