数据库索引数据结构btree,b-tree和b+tree树
1.B-Tree树的介绍:
1)是一种适用于外查找的树,它是一种平衡的多叉树,称为B树
2)一颗M阶B-Tree具有的特性:
1)如果根结点不是叶子结点的话,那么它的子结点数至少为2
2)除结点与叶子结点外,其他结点的孩子数为[ceil(m/2),m]个,ceil函数表示向上取整数
3)所有叶子结点都在同一层(因为它是分裂向上生成父结点的)
4)各个结点的关键字都是从小到大排序的,
5)且每个结点的关键字数量满足[ceil(m / 2)-1,m-1],floor为向下取整函数
6)父结点的关键字的左孩子都小于它,右孩子都大于它.
3)B-Tree树的插入操作
1)插入新元素,如果叶子结点的空间足够,则插入其中,根据与根节点的判断其插入的位置
2)如果结点空间满了的话,进行分裂,将结点中的中间关键字上移作为父节点,将结点中的其他的一半关键字分别作为此结点的左右结点
4)B-Tree树的删除操作
1)先查找B-tree树需要删除的元素,如果该元素在B-tree中存在,则将该元素在结点中删除
2)删除元素后,判断元素有无左右孩子结点,如果有,则上移与删除元素相近的孩子结点元素到父结点中;
3)然后判断所有结点中元素个数个数是否有小于ceil(m/2)-1的,找到其相邻兄弟元素个数是否大于ceil(m/2)-1
如果足够:
1)向父节点借一个元素,同时将借的元素的孩子结点中相邻后继元素上移到父结点中;
如果不够:
2)其相邻兄弟借完后结点元素个数少于floor(m/2),那将父结点的元素下移到要合并的左右子结点中,然后进行合并(且父元素的值应该是处于左右孩子之间的)
3)由于索引文件,无论是插入还是删除B-Tree结点,不断地分裂和合并结点来维持B-Tree结构是非常昂贵的操作,所有数据库的索引都采用的B+tree
2.B+Tree树的介绍:
1)MySQL索引采用B+Tree,它是应文件系统所需而产生的一种B-tree的变形树
2)与B-Tree树的差异:
1)非叶子结点的子树指针与关键字个数相同
2)B+树父结点中记录,存储的是下层子树中的最小值
3)所有叶子结点通过一个链指针相连
4)所有关键字都在叶子结点出现;
3)B+Tree的分裂:
1)当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;
2)B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针;
3.B*Tree的介绍:
1)B*Tree是B+树的变体,在B+Tree的非根和非叶子结点再增加指向兄弟的指针
2)B*Tree的区别:
1)B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3(代替B+树的1/2);
2)B*树的分裂:
1)当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,
2)再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了)
3);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针;
4.总结:
B-树:多路搜索树,每个结点存储floor(M/2)到M-1个关键字,非叶子结点存储指向关键字范围的子结点;
所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中
B+树:在B-树的基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现
,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中
B*树:在B+树的基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3
补充:B*树分配新结点的概率比B+树要低,空间使用率更高
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火,是硬核还是营销?