MySQL学习记录 - 索引

一、B树

特点

一个M阶的B树具有如下几个特征:(如下图 M=3)(下文的关键字可以理解为有效数据,而不是单纯的索引)

定义任意非叶子结点最多只有 M 个儿子,且 M>2

根结点的儿子数为[2, M]除根结点以外的非叶子结点的儿子数为[M/2, M],向上取整; (儿子数:[2,3])

非叶子结点的关键字个数=儿子数-1;(关键字=2)

所有叶子结点位于同一层

k 个关键字把节点拆成 k+1 段,分别指向 k+1 个儿子,同时满足查找树的大小关系。 (k=2)

 

有关B树的一些特性,注意与后面的B+树区分:

关键字集合分布在整棵树中

任何一个关键字出现且只出现在一个结点中

搜索有可能在非叶子节点结束

其搜索性能等价于在关键字全集内做一次二分查找;

 

 

二、B+树

特点

一个M阶的 B+ 树具有如下几个特征:

有 n 棵子树的非叶子结点中含有 n 个关键字(b 树是 n-1 个),这些关键字不保存数据, 只用来索引,所有数据都保存在叶子节点(b 树是每个关键字都保存数据)

所有的叶子结点中包含了全部关键字的信息,及指向含这些关键字记录的指针,且叶子 结点本身依关键字的大小自小而大顺序链接

所有的非叶子结点可以看成是索引部分,结点中仅含其子数中的最大(或最小)关键字

通常在 b+树上有两个头指针,一个指向根结点,一个指向关键字最小的叶子结点

同一个数字会在不同节点中重复出现,根节点的最大元素就是 b+树的最大元素

三、B*树

 

四、选用B+树作为数据库的索引结构的原因

1、B+树的中间节点不保存数据,是纯索引。但是 B 树的中间节点是保存数据和索引的,相对来说,B+树磁盘也能容纳更多节点元素,更“矮胖”B+树查询必须查找到叶子节点,

2、B树只要匹配到即可不用管元素位置,因此B+树查找更稳定(并不慢)

3、对于范围查找来说,B+树只需遍历叶子节点链表即可,B树却需要重复地中序遍历,在项目中范围查找又很是常见的。

4、增删文件(节点)时,效率更高,因为 B+树的叶子节点包含所有关键字,并以有序的链表结构存储,这样可很好提高增删效率

 

五、索引命中查看

explain看看SQL的执行计划

 

六、延伸知识

问:为什么MongoDB用 B 树做索引,而MySQL用B+ 树做索引?

答:MongoDB 单一查询比较多,联合查询比较少,遍历的情况比较少。B 树 所有节点上存在数据信息,适合单一查询。

MySQL 是关系型数据库,遍历查询比较多,而B+树,数据信息存在叶子节点上,并且叶子节点直接又指针链接,更适用于范围查询。

 

 

参考资料

MySQL为什么用B+树作索引?聚集与非聚集索引的区别?

一篇文章彻底搞懂MySQL的索引原理

如何监测MySQL是否命中索引?

为什么Mongodb索引用B树,而Mysql用B+树?

posted @ 2020-09-06 16:11  风过无痕521  阅读(103)  评论(0编辑  收藏  举报