第二节:MySQL索引的底层数据结构原理剖析(二叉树、 红黑树、Hash、B-Tree、B+Tree)
一. 前言
1. 说明
我们平时所说的:聚集索引(主键索引),次要索引,覆盖索引,复合索引,前缀索引,唯一索引在MySQL5.7和 8.0版本默认都是使用B+Tree索引,除此之外还有 Hash索引。至于MySQL5.7之前版本,这里就不过多探究了。
学习各种数据结构图解网站:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html (推荐)
2. 有索引和没索引的区别
下图,左边表格是没有索引,右边是二叉树索引,以col2为索引列.
PS: 在右边二叉树的结构中,每个节点都是 key-value 键值对的形式。key:col2所在行在磁盘文件中的地址指针(比如 34 所在行,通过key中存储 0x07 这个指针就能找到是第1行),value:就是col2的值。
分析下面SQL语句
select * from t where col2 = 89;
(1). 左边没有索引,搜索col2=89需要从上往下搜索, 6次 才能找到,也就是 6次回表操作(6次IO)。
(2). 右边是二叉树索引,搜索col2=89搜索 2次 就可以找到,也就是 2次回表操作(2次IO),性能提升明显。
二. 二叉树、红黑树、Hash
1. 二叉树
(1). 二叉树的特点
左子节点值 < 节点值;右子节点值 > 节点值;当数据量非常大时,要查找的数据又非常靠后,和没有索引相比,那么二叉树结构的查询优势将非常明显。
(2). 存在的问题
如下图,可以看出,二叉树出现单边增长时,二叉树变成了“链”,这样查找一个数的时候,速度并没有得到很大的优化。
2. 红黑树
(1). 特点
A. 节点是红色或者黑色
B. 根节点是黑色
C. 每个叶子的节点都是黑色的空节点(NULL)
D. 每个红色节点的两个子节点都是黑色的。
E. 从任意节点到其每个叶子的所有路径都包含相同的黑色节点。
(2). 存在的问题
红黑树虽然和二叉树相比,一定程度上缓解了单边过长的问题,但是它依旧存储高度问题。
假设现在数据量有100万,那么红黑树的高度大概为 100,0000 = 2^n, n大概为 20。那么,至少要20次的磁盘IO,这样,性能将很受影响。如果数据量更大,IO次数更多,性能损耗更大。所以红黑树依旧不是最佳方案。
(3). 思考:针对上面的红黑树结构,我们能否优化一下呢?
上述红黑树默认一个节点就存了一个 (索引+磁盘地址),我们设想一个节点存多个 (索引+磁盘地址),这样就可以降低红黑树的高度了。 实际上我们设想的这种结构就是 B-Tree。
3. Hash
(1). 原理
A. 事先将索引通过 hash算法后得到的hash值(即磁盘文件指针)存到hash表中。
B. 在进行查询时,将索引通过hash算法,得到hash值,与hash表中的hash值比对。通过磁盘文件指针,只要一次磁盘IO就能找到要的值。
例如:
在第一个表中,要查找col=6的值。hash(6) 得到值,比对hash表,就能得到89。性能非常高。
(2). 存在的问题
但是hash表索引存在问题,如果要查询 带范围的条件时,hash索引就歇菜了。
select *from t where col1>=6;
三. B-Tree 和 B+Tree
1. B-Tree
(1). 特点
B-Tree索引能很好解决红黑树中遗留的高度问题,B-Tree 是一种平衡的多路查找(又称排序)树,在文件系统中和数据库系统有所应用,主要用作文件的索引,其中的B就表示平衡(Balance)。
为了描述B-Tree,首先定义一条数据记录为一个二元组 [key, data],key为记录的键值key,对于不同数据记录,key是互不相同的;data为数据记录除以key外的数据 (这里指的是聚集索引)。那么B-Tree是满足下列条件的数据结构:
A. d 为大于1的一个正整数,称为BTree的度;
B. h为一个正整数,称为BTree的高度;
C. key和指针互相间隔,节点两端是指针;
D. 叶子节点具有相同的深度,叶子节点的指针为空,节点中数据索引(下图中的key)从左往右递增排列。
说明:下面的图都是以主键索引为例来画图,至于非主键索引(非聚集索引),无非就是data里存的内容不同,详细对比见后面章节。
图1:
图2:
(2). 分析
模拟下查找key为29的data的过程:
A、根据根结点指针读取文件目录的根磁盘块1。【磁盘IO操作第1次】
B、磁盘块1存储17,35和三个指针数据。我们发现17<29<35,因此我们找到指针p2。
C、根据p2指针,我们定位并读取磁盘块3。【磁盘IO操作2次】
D、磁盘块3存储26,30和三个指针数据。我们发现26<29<30,因此我们找到指针p2。
E、根据p2指针,我们定位并读取磁盘块8。【磁盘IO操作3次】
F、磁盘块8中存储28,29。我们找到29,获取29所对应的数据data。
(3). 存在问题
A. 比如,下面查询语句,那么不但需要叶子节点>20的值,也需要非叶子节点在右边节点的值。即下图画圈的两部分, B-Tree似乎在范围查找没有更简便的方法,为了解决这一问题。我们可以用B+Tree。
select *from t where col1 > 20;
B. 深度问题
从图上可以看到,每个节点中不仅包含数据的key值,还有data值。而每一个节点的存储空间是有限的(mysql默认设置一个节点的大小为16K),如果data中存放的数据较大时,将会导致每个节点(即一个页)能存储的key的数量(索引的数量)很小,所以当数据量很多,且每行数据量很大的时候,同样会导致B-Tree的深度较大,增大查询时的磁盘I/O次数,进而影响查询效率。所以引入B+Tree
2. B+Tree
(1). 特点
B+Tree
是在B-Tree
基础上的一种优化,使其更适合实现外存储索引结构。在B+Tree中,所有数据记录节点都是按照键值大小顺序存放在同一层的叶子节点上,而非叶子节点上只存储key值信息,这样可以大大加大每个节点存储的key值数量,降低B+Tree的高度。
A. 非叶子节点不存储data,只存储索引和指针,可以存放更多索引。
B. 叶子节点不存储指针。
C. 顺序访问指针,提高区间访问性能。
D. 非叶子节点中的索引最终还是会在叶子节点上存储一份,也就是叶子节点会包含非叶子节点上的所有索引。
E. 一个父节点,它的左侧子节点都小于父节点的值,右侧的子节点都大于等于父节点的值。
F. 每一层节点从左往右都是递增排列,无论是数值型还是字符型。
注:MySQL索引默认的存储结构使用的就是B+Tree。
图1:
图2:
剖析:如上图,在叶子节点上注意是MySQL已经有成双向箭头(原生B+Tree是单向的),而且从左到右是递增顺序的,所以很好的解决了 > 和 < 这类查找问题。
(2). 分析
假如:以一个高度为3的B+Tree为例,B+Tree的表都存满了,能存储多少数据?
首先,查看MySQL默认一个节点页的大小:
SHOW GLOBAL STATUS like 'Innodb_page_size';
如下图:大小为16K。
然后,假设主键Id为bigint类型,那么长度就是8B,指针在Innodb源码中大小为6B,所以一共就是14B,再假设最后一层,存放的数据data为1k 大小(能存很多内容了),那么
A. 第一层最大节点数为: 16k / (8B + 6B) = 1170 (个);
B. 第二层最大节点数也应为:1170个;
C. 第三层最大节点数为:16k / 1k = 16 (个)。
前提假设:
-
假设B+树的高度为3层、单条数据的存储空间为1KB(能存非常多了)
-
假设主键是bigint类型
常识:
-
Innodb中数据页的默认大小为16KB,并且B+树每个节点(根节点、叶子节点、非叶子节点)都对应一个数据页。即每个节点的大小为16KB
-
根节点和非叶子节点都存放到是:指针+主键索引。
-
bigint类型主键为8byte(字节),指针默认为6byte(字节)
-
根节点对应一个数据页,并不是只能存放一个数据,而是可以存放很多对:指针+主键索引,每个指针又可以指向一个节点(如果是非叶子节点的话,又可以存放很多对:指针+主键索引)。
-
叶子节点存放的是数据,一个叶子节点可以存放很多条数据,并不是只能存放一条数据哦。
计算:
1 第一层根节点,可以存放多少对 指针+主键索引:
16 * 1024 /(8+6) = 1170
2 第二层:
(1). 第一层中的每个指针都可以指向一个节点,所以第二层可以有 1170个节点
(2). 第二层中的每个节点同样可以存放 1170对 指针+主键索引
(3). 第二次中的每个指针都可以指向第三次的一个节点,所以第三层可以有:
1170 * 1170 = 1368900 个叶子节点
3 第三层:
(1). 每个节点可以存放: 16 kb /1kb =16条 数据
(2). 第三层有 1170*1170个叶子节点,所以总共有:
1170 * 1170 * 16 =21902400 条数据,约等于 2000万
则,一张B+Tree的表最多存放 1170 * 1170 * 16 = 21902400 ≈ 2千万。所以,通过分析,我们可以得出,B+Tree结构的表可以容纳千万数据量的查询。而且一般来说,MySQL会把 B+Tree 根节点放在内存中,那只需要两次磁盘IO(第二层1次,第三层1次)就行。
(3). 扩展
数据库中的B+Tree索引可以分为聚集索引(clustered index,也叫主键索引)和辅助索引(secondary index,也叫非聚集索引)。
上面的B+Tree示例图在数据库中的实现对应的是聚集索引,聚集索引的B+Tree中的叶子节点存放的是整张表的行记录数据(除主键以外的所有数据),辅助索引与聚集索引的区别在于辅助索引的叶子节点并不包含行记录的全部数据,而是存储相应行数据的对应的聚集索引键,即主键。当通过辅助索引来查询数据时,InnoDB存储引擎会遍历辅助索引找到主键,然后再通过主键在聚集索引中找到完整的行记录数据。
四. 深究索引在B+Tree上的存储
说明:下面的介绍均是指InnoDB存储引擎B+Tree
1. 聚集索引
聚集索引也叫主键索引,叶子节点中的data存储的是该主键对应整行数据,通常B+Tree的高度为3,也就是有三层节点,MySQL会把B+Tree第一层也就是根节点放在内存中,我们根据主键索引查数据,只需要两次磁盘IO(第二层1次,第三次1次)即可。寻址过程类似上面B-Tree那个寻址步骤。
2. 非聚集索引
非聚集索引也叫辅助索引,叶子节点中的data存储的该索引对应的该行数据的主键值,所以非聚集索引的寻址过程分两种情况:
(1). 非聚集索引已经索引覆盖了,那么只需要遍历这非聚集索引这一个B+Tree即可,按照上面的分析,需要两次磁盘IO即可(mysql会把根节点放到内存中)。
(2). 非聚集索引不能索引覆盖,那么先需要在非聚集索引这个B+Tree上两次IO找到该行数据对应的主键值,然后拿着主键去 聚集索引的B+Tree上找对应的其它数据。相比第一种情况IO次数要多,所以我们通常喜欢索引覆盖。
下图表示非聚集索引不能索引覆盖的情况:
右侧的辅助索引先拿到主键值5,然后去左侧的主键索引中寻址,最后可以得到整行内容。
3. 联合索引
假设有一张表T1,有id、x1、x2、x3、x4字段,id上有主键索引,给x1、x2、x3添加联合索引,如下图:
剖析:
(1). 上图联合索引的key中存储x1-x2-x3三个值,存储顺序从左往右依次递增,
先比较x1,如:10002<10004,
如果x1相同,在比较x2,如 Assistant < Engineer
如果x2相同,再比较x3,如 1997-08-03 < 2001-09-03
(2). 如果查找x1 x2 x3,在非聚集索引这个B+Tree直接就可以从key中拿到,如果还要查找x4,则需要拿到data中存储的主键值,然后再去聚集索引中查找。(这就是为什么首选覆盖索引的原因)
4. 灵魂拷问
(1). 为什么InnoDB表必须有主键,并且推荐使用整型的自增主键?
A. 为什么要有主键?
mysql底层就是用B+Tree维护的,而B+Tree的结构就决定了必须有主键才能构建B+Tree树这个结构。每个表在磁盘上,是单独的一个文件。索引和数据都在其中,文件是按照主键索引组织的一个B+TREE结构。假如没有定义主键,MySQL会在挑选能唯一标识的字段作为索引;假如找不到,会生成一个默认的隐藏列作为主键列。
B. 为什么用整型主键?
假如使用类似 UUID 的字符串作为主键,那么在查找时,需要比较两个主键是否相同,这是一个相比整型比较 非常耗时的过程。需要一个字符,一个字符的比较,自然比较慢。
C. 为什么用自增主键?
① 后面的主键索引总是大于前面的主键索引,在做范围查询时,非常方便找到需要的数据。
② 在添加的过程中,因为是自增的,每次添加都是在后面插入,树分裂的机会小;而UUID大小不确定,分裂机会大,需要重新平衡树结构,性能损耗大。
(2). 为什么非主键索引结构叶子节点存储的是主键值,而不是全部数据?
① 节省空间:指向主键的节点,不用再存储一份相同的数据;(否则的话,如果建立多个非主键索引,每个上面都存储的完整数据,非常占用空间)
② 数据一致性:如果修改索引15 的数据,那只要修改主键的 data,而如果非主键的data也存一份的话,那得修改两份,这样就涉及到事务一致性的问题,耗时,性能低。
(3). 为什么希望使用覆盖索引?
如果非聚集索引中能索引覆盖,那么我们只需要遍历非聚集索引这个B+Tree从其中的Key里拿到索引值就可,只需要遍历一棵树。 如果不能索引覆盖,需要先遍历非聚集索引,然后拿到data中存储的主键值,再去聚集索引中遍历查找数据,相比索引覆盖的话,IO次数更多,性能相对低。
五. MyISAM和InnoDB的索引结构对比
1. MyISAM下索引结构
MyISAM索引文件和数据文件是分开的(非聚集),存储引擎在磁盘中文件有三个,
一个是 .frm 文件(数据表定义),
一个是 .MYI(索引),
一个是 .MYD(实际数据,存储的是一整行的数据,包括索引值)。
MY文件是B+Tree为底层组织的文件。
剖析: 比如查找 49,那么在 .MYI 中找到 49对应的磁盘指针 0x49,根据 0x49 去 .MYD找到实际的数据内容data。
注:在MyISAM存储引擎中,无论是主键索引还是非主键索引,B+Tree中叶子结点中的data存储的都是该行数据对应的磁盘指针,根据指针再去拿数据。
2. InnoDB索引结构
InnoDB存储引擎它的表数据文件本身就是按 B+Tree 组织的一个索引文件。不同于MyISAM存储引擎是,数据不分离。
一个frm文件存储数据表定义,一个ibd文件存放的索引和实际数据。
如下图一,为聚集索引,找到49的索引之后,数据就在该节点,不必像MyISAM存储引擎那样,需要根据磁盘指针到另一个文件中取数据。性能比MyISAM高。
!
- 作 者 : Yaopengfei(姚鹏飞)
- 博客地址 : http://www.cnblogs.com/yaopengfei/
- 声 明1 : 如有错误,欢迎讨论,请勿谩骂^_^。
- 声 明2 : 原创博客请在转载时保留原文链接或在文章开头加上本人博客地址,否则保留追究法律责任的权利。