B树

多路查找树

二叉树与B树

1.二叉树的问题分析

二叉树的操作效率高,但也存在一些问题:

1)二叉树需要加载进内存,如果二叉树的结点少,没什么问题,但是如果二叉树的结点很多,就会存在如下问题:

​ ① 在构建二叉树时,需要多次进行I/O操作,结点海量,构建二叉树,速度又影响。

​ ②结点海量,也会造成二叉树高度很高,会降低操作速度。

2.多叉树

1)在二叉树中,每个结点又数据项,最多有两个子节点,如果允许每个结点可以有更多的数据项和更多的子节点,就是多叉树。

2)2-3树、2-3-4树就是多叉树,多叉树通过重新组织结点,减少树的高度,能对二叉树进行优化。

2-3树

  1. 2-3树介绍

2-3树是最简单的B-树结构,特点:

1)2-3树的所有叶子节点都在同一层(只要是B树都满足这个条件)

2)有两个子节点的结点叫二结点,二结点要么没有子节点,要么有两个子节点。

3)有三个子节点的结点叫三节点,三节点要么没有子节点,要么有三个子节点。

4)2-3树是由二节点和三节点构成的树

  1. 2-3树的应用案例

将数列{16,24,12,32,14,26,34,10,8,28,38,20}构建成2-3树,并保存数据插入的大小顺序。

构建过程:

B树、B+树和B*树

B-tree树即B树,B即Balanced,,前面的2-3树和2-3-4树他们都是B树。我们在学习mysql时索引的底层基于B树或者B+树。

B树说明:

1)B数的阶:结点的最多子节点个数,比如2-3树的阶为3,2-3-4树的阶为4.

2 )B-树的搜索,从根节点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的二子结点。重复,直到所对应的儿子节点指针为空,或者已经时叶子结点。

3)关键字集合分布在整个树中,即叶子节点和非叶子节点存放数据。

4)搜索有可能在非叶子节点结束。

5)其搜索性能等价于在关键字全集内做一次二分查找。

2.B+树是B树的变体

1)B+树的搜索与B树也基本相同,区别是B+树只有达到叶子结点才命中(B树可以在非叶子节点命中),其性能也等价与在关键字全集内做一次二分查找。

2)所有的关键字都出现在叶子节点的链表中(即数据只能在叶子节点【也叫稠密索引】),且链表中的关键字恰好是有序的。

3)不可能在非叶子节点命中。

4)非叶子节点相当于是叶子结点的索引(稀疏索引),叶子节点相当于存储(关键字)数据的数据层。

5)跟适合文件索引系统。

posted @ 2021-05-15 15:49  撑起一片阳光  阅读(200)  评论(0编辑  收藏  举报