Mysql的InnoDB引擎-5.索引(1)

数据结构和算法

二分查找法

二分查找法也称为折半查找法。其基本思想是:将记录按照有序排列,在查找过程中采用跳跃式方式查找,即先以有序数列的中点进行大小对比,如果小于中心点元素,那么数据在中心点左侧,每次查询数据都将区间缩小一半,知道查询到对应数据。

二叉查找树和平衡二叉树

二叉树是一个经典的数据结构。具体如下图。

 

 

二叉查找树具体如图,左子树的键值总是小于根的键值,右子树的键值总是大于根的键值。因此可以通过中序遍历获取排序后的数据

 

 

 

 

 树的遍历分为前序遍历,中序遍历,后序遍历。

  • 先序遍历:遍历顺序规则为【根左右】   7,4,2,1,3,6,5,9,8,10
  • 中序遍历:遍历顺序规则为【左根右】   1,2,3,4,5,6,7,8,9,10
  • 后序遍历:遍历顺序规则为【左右根】   1,3,2,5,6,4,8,10,9,7

平衡二叉树定义:首先符合二叉树的定义,其次必须满足任何节点的两个紫薯的高度最大差为1。平衡二叉树的查询效率很高,但是维护成本很大,在平衡二叉树进行插入删除以及更新操作的时候,要进行左旋或者右旋完成重新排序平衡二叉树。

B+树

和二叉树、平衡二叉树类似的数据结构。B+树由B树和索引顺序访问方法演化而来。

B+树是为磁盘或者其他直接存取辅助设备的一种平衡查找树,在B+树中,所有记录节点都是按键值的大小顺序存放在同一层的叶子节点上,由各个叶子节点指针进行连接。

如下:其高度为2,每页存放4条记录,扇出(fan out)为5。所有记录都在叶子节点上,并且是顺序存放的。

 

 

 插入操作

B+树的插入必须保证插入后叶子节点中的记录依然排序,同时需要考虑插入到B+树的三种情况,每种情况都会导致不同的插入算法。如下所示:

Leaf Page 满 Index Page 满 操作
No Yes

直接将记录插入到叶子节点

Yes No

1.查分Leaf Page
2.将中间的节点放入到Index Page中
3.小于中间节点的记录放在左边
4.大于或等于中间节点的记录放在右边

Yes Yes

1.拆分Leaf Page
2.小于中间节点的记录放在左边
3.大于或等于中间节点的记录放在右边
4.拆分Index Page
5.小于中间节点的记录放在左边
6.大于中间节点的记录放在右边
7.中间节点放入上一层Index Page

 

 

 

 

 

 

 

 

 

 

 

1、如下图这颗B+树,若用户插入28这个值,发现当前叶子页leafPage和IndexPage索引页都没有满,直接插入就行。

 

                  (1)

 

 

                  (2)

 2、从上图接着插入70这个键值,这时原来的leafPage已经满了,但是IndexPage还没有。这时插入leafPage后的情况为50、55、60、65、70,并根据中间值60来拆分叶子节点,可得下图。

 

                  (3)

为了保持平衡对于新插入的键值可能需要做大量的拆分页(split)操作。因为B+树结构主要用于磁盘,也拆分意味着磁盘操作,所以应该在可能的情况下尽量减小页的拆分操作。因此B+树会提出平衡二叉树的旋转(Rotation)功能。

旋转发生在leafPage已满,但是其左右兄弟节点没有满的情况下。这时B+树不会急于去拆分页操作,而是将记录移到所在页的兄弟页节点上,通常情况下,左兄弟会被首先检查用来做旋转操作。若如此,插入70应该左旋为:

 

                  (4)

 

3、最后插入95,这时复合第三种情况,即leafPage和IndexPage都满了,这时需要做两次拆分

                  

 B+树的删除操作

B+树使用填充因子来控制树的删除变化,50%是填充因子可设的最小值。B+树的删除操作同样必须保证删除后叶子节点中的记录依然排序,同插入一样,B+树的删除操作同样需要考虑三种情况。与插入不同的是,删除根据填充因子的变化来衡量。

叶子节点小于填充因子 中间节点小于填充因子 操作
No No

直接将记录从叶子节点删除,如果该节点还是Index Page的节点,用该节点的右节点代替

Yes No

合并叶子节点和他的兄弟节点,同时更新Index Page

Yes Yes

1.合并叶子节点和他的兄弟节点
2.更新Index Page
3.合并Index Page 和它的兄弟节点

 

 

 

 

 

 

 

1、根据图(5)的B+树来进行删除。首先删除键值为70的记录:

 

                  (6)

接着删除键值为25的记录,但是该值还是IndexPage中的值,因此在删除LeafPage中的25后,还应将25的右兄弟节点28更新到PageIndex中,如图:

 

                   (7)

最后删除60这个键值。删除LeafPage中键值为60的记录后,Fill Factor小于50%,这时需要做合并操作,同样,在删除IndexPage中相关记录后需要做IndexPage的合并操作。

 

                    (8)

 

posted @ 2020-04-21 15:43  名字可以起这么长  阅读(148)  评论(0编辑  收藏  举报