InnoDB索引存储结构

原创转载请注明出处：https://www.cnblogs.com/agilestyle/p/11429438.html

InnoDB默认创建的主键索引是聚簇索引（Clustered Index），其它索引都属于辅助索引（Secondary Index），也被称为二级索引或非聚簇索引。

接下来通过一个简单的例子，说明下这两种索引在存储数据中的具体实现。

首先创建一张商品表，如下：

1 CREATE TABLE `merchandise`  (
2   `id` int(11) NOT NULL,
3   `serial_no` varchar(20)  DEFAULT NULL,
4   `name` varchar(255) DEFAULT NULL,
5   `unit_price` decimal(10, 2) DEFAULT NULL,
6   PRIMARY KEY (`id`) USING BTREE
7 ) CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

然后新增了以下几行数据，如下：

使用的是InnoDB存储引擎，由于InnoDB使用的是聚簇索引，聚簇索引中的叶子节点则记录了主键值、事务id、用于事务和MVCC的回流指针以及所有的剩余列，如下图所示：

基于上面的图示，如果需要根据商品编码serial_no查询商品，就需要将商品编码serial_no列作为一个索引列。此时创建的索引是一个辅助索引，但叶子节点存储的就不是行指针了，而是主键值，并以此来作为指向行的指针。这样的好处就是当行发生移动或者数据分裂时，不用再维护索引的变更。

回表

如果使用主键索引查询商品，则会按照B+树的索引找到对应的叶子节点，直接获取到行数据：

1 select * from merchandise where id = 7

如果使用serial_no查询商品，即使用辅助索引进行查询，则会先检索辅助索引中的B+树的serial_no，找到对应的叶子节点，获取主键值，然后再通过聚簇索引中的B+树检索到对应的叶子节点，然后获取整行数据。这个过程叫做回表。

回表就是先通过辅助索引扫描出数据所在的行，再通过行主键id取出索引中未提供的数据，即基于非主键索引的查询需要多扫描一棵索引树。

覆盖索引

假设只需要查询商品的名称、价格信息，有什么方式来避免回表呢？可以建立一个组合索引，即商品编码、名称、价格作为一个组合索引。如果索引中存在这些数据，查询将不会再次检索主键索引，从而避免回表。

从辅助索引中查询得到记录，而不需要通过聚簇索引查询获得，MySQL中将其称为覆盖索引。使用覆盖索引的好处很明显，不需要查询出包含整行记录的所有信息，因此可以减少大量的I/O操作。

通常在InnoDB中，除了查询部分字段可以使用覆盖索引来优化查询性能之外，统计数量也会用到。例如， SELECT COUNT(*)时，如果不存在辅助索引，此时会通过查询聚簇索引来统计行数，如果此时正好存在一个辅助索引，则会通过查询辅助索引来统计行数，减少I/O操作。

 1 CREATE TABLE `test` (
 2   `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
 3   `a` varchar(32) NOT NULL,
 4   `b` varchar(32) NOT NULL,
 5   `c` varchar(64) NOT NULL,
 6   `d` varchar(128) NOT NULL,
 7   `e` varchar(256) NOT NULL,
 8   `create_time` timestamp(3) NOT NULL DEFAULT current_timestamp(3),
 9   `update_time` timestamp(3) NOT NULL DEFAULT current_timestamp(3) ON UPDATE current_timestamp(3),
10   PRIMARY KEY (`id`),
11   KEY `idx_a_b` (`a`,`b`)
12 ) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8mb4;

Reference

https://time.geekbang.org/column/article/116369

https://zhuanlan.zhihu.com/p/27700617

posted @ 2019-08-29 14:17 李白与酒阅读(4059) 评论(0) 收藏举报

刷新页面返回顶部

TechStyle

精通高等数学、线性代数、概率论与数理统计 => 高阶IT从业大神

InnoDB索引存储结构

回表

覆盖索引

Reference

公告

TechStyle

精通 高等数学、线性代数、概率论与数理统计 => 高阶IT从业大神

InnoDB索引存储结构

回表

覆盖索引

Reference

公告

精通高等数学、线性代数、概率论与数理统计 => 高阶IT从业大神