Innodb MVCC源码实现

1. 概述

MVCC:

即多版本一致性,在事务模型下,使用version控制数据版本,关系型数据库基本都实现了MVCC,以对表数据的读写互不阻塞,增大了并发量。

Oracle和MySQL数据库都是使用undo的机制来实现MVCC。
但数据库都实现了多个事务的隔离级别,所以MVCC中对可见性的判断,也会因事务的隔离级别不同而不相同。

2. 相关数据结构

struct trx_struct{
read_view_t*    global_read_view;
read_view_t*    read_view;
......
}

事务结构体:每一个sql根据read_view或者global_read_view来实现一致性读取。

struct read_view_struct{
trx_id_t    low_limit_no;
trx_id_t    low_limit_id;
trx_id_t    up_limit_id;
ulint    n_trx_ids;
trx_id_t*    trx_ids;
......
}

read_view结构体:包括当前的活动事务的范围,以及活动事务数组,对于每一行记录,根据记录中的trx_id以及当前查询的read_view
进行判断记录的可见性。

3. 记录和undo

记录的格式:

  每一条记录都包括:主键,trx_id, undo_point, columns
  undo_point指向了行记录的前映像,一致性版本就是通过undo来构造。

比如测试用例:
session1:
  create table test(id int primary key, name varchar(100));
  insert into test values(1, 'xxxx');
  commit;
session2:
  update test set name='yyyy' where id=1;

其形成的记录的格式如下图所示:

  

这里只体现了undo的一个链表,我们称为undo的深度链表,用于实现mvcc。

还存在一个undo的链表,是一个广度链表,记录了这个事务的所有undo,用于rollback,回滚事务。下一篇blog介绍undo相关的内容。

 

3. 可见性判断

函数:read_view_sees_trx_id。


read_view中保存了当前全局的事务的范围:
【low_limit_id, up_limit_id】

1. 当行记录的事务ID小于当前系统的最小活动id,就是可见的。
  if (trx_id < view->up_limit_id) {
    return(TRUE);
  }
2. 当行记录的事务ID大于当前系统的最大活动id,就是不可见的。
  if (trx_id >= view->low_limit_id) {
    return(FALSE);
  }
3. 当行记录的事务ID在活动范围之中时,判断是否在活动链表中,如果在就不可见,如果不在就是可见的。
  for (i = 0; i < n_ids; i++) {
    trx_id_t view_trx_id
      = read_view_get_nth_trx_id(view, n_ids - i - 1);

    if (trx_id <= view_trx_id) {
    return(trx_id != view_trx_id);
    }
  }

4. 事务隔离级别的影响

但是:对于两张不同的事务隔离级别
  tx_isolation='READ-COMMITTED': 语句级别的一致性:只要当前语句执行前已经提交的数据都是可见的。
  tx_isolation='REPEATABLE-READ'; 语句级别的一致性:只要是当前事务执行前已经提交的数据都是可见的。

针对这两张事务的隔离级别,使用相同的可见性判断逻辑是如何做到不同的可见性的呢?

 

这里就要看看read_view的生成机制:

1. read-commited:
  函数:ha_innobase::external_lock

  if (trx->isolation_level <= TRX_ISO_READ_COMMITTED
    && trx->global_read_view) {
    /* At low transaction isolation levels we let
    each consistent read set its own snapshot */

  read_view_close_for_mysql(trx);

 

即:在每次语句执行的过程中,都关闭read_view, 重新在row_search_for_mysql函数中创建当前的read_view。
这样就可以根据当前的全局事务链表创建read_view的事务区间,实现read committed隔离级别。

2. repeatable read:
  在repeatable read的隔离级别下,创建事务trx结构的时候,就生成了当前的global read view。
  使用trx_assign_read_view函数创建,一直维持到事务结束,这样就实现了repeatable read隔离级别。

posted @ 2014-08-20 19:43  xpchild  阅读(831)  评论(1编辑  收藏  举报