B树与B+详解
本人已迁移博客至掘进,以后会在掘进平台更新最新的文章也会有更多的干货,欢迎大家关注!!!https://juejin.im/user/588993965333309
承接上篇SQLite采用B树结构使得SQLite内存占用资源较少,本篇将讲述B树的具体操作(建树,插入,删除等操作)。在看博客时,建议拿支笔和纸,一点一点操作,毕竟知识是自己的,自己也要消化的。本篇通读下来,大约需要25-35分钟,关键掌握B树的具体操作思想,欢迎大家指正。
一、前言
动态查找树主要包括:二叉查找树,平衡二叉树,红黑树,B树,B-树,查找的时间复杂度就为O(log2N),通过对数就可以发现降低树的深度就会提高查找效率。在大数据存储过程,大量的数据会存储到外存磁盘,外存磁盘中读取与写入某数据的时候,首先定位到磁盘中的某一块,这就有个问题:如何才能有效的查找磁盘中的数据呢,这就需要一种高效的外存数据结构,也就引出了下面的课题。
B树为了存储设备或者磁盘而设计的一种平衡查找树,与红黑树类似(拓展会讲)。
拓展:
B树与红黑树的
不同在于:B树的节点可以有很多子女,从几个到几万个不等,
相同:一颗含有n个节点的B树高度和红黑树是一样的,都是O(lgn)。
二、定义
1.B树
(1)一棵m阶的B树,特性如下:
利用书面的定义(参考书籍-《数据结构》)
1)树中的每个结点最多含有m个孩子;
2)除了根结点和叶子结点,其他结点至少有[ceil(m / 2)(代表是取上限的函数)]个孩子;
3)若根结点不是叶子结点时,则至少有两个孩子(除了没有孩子的根结点)
4)所有的叶子结点都出现在同一层中,叶子结点不包含任何关键字信息;
(2)B树的类型与节点定义
#define m 1024 struct BTNode; typedef struct BTNode *PBTNode; struct BTNode { int keyNum;//实际关键字个数,keyNum < m PBTNode parent;//指向父亲节点 PBTNode *ptr; keyType *key;//关键字向量 } typedef struct BTNode *BTree; typedef BTree *PBTree;
2.B+树
B+树可以说是B树的一种变形,它把数据都存储在叶结点,而内部结点只存关键字和孩子指针,因此简化了内部结点的分支因子,B+树遍历也更高效,其中B+树只需所有叶子节点串成链表这样就可以从头到尾遍历,其中内部结点是并不存储信息,而是存储叶子结点的最小值作为索引,下面将讲述到。
定义:参考数据《数据结构》与百度百科
B+树用于数据库和文件系统中,NTFS等都使用B+树作为数据索引,
1)有n棵子树的结点含有n个关键字,每个关键字都不会保存数据,只会用来索引,并且所有数据都会保存在叶子结点;
2)所有的叶子结点包含所有关键字信息以及指向关键字记录的指针,关键字自小到大顺序连接;
参考下图(来自百度百科)
三、问答
1.为什么说B+树比B树更适合做操作系统的数据库索引和文件索引?
(1)B+树的磁盘读写的代价更低
B+树内部结点没有指向关键字具体信息的指针,这样内部结点相对B树更小。
(2)B+树的查询更加的稳定
因为非终端结点并不是最终指向文件内容的结点,仅仅是作为叶子结点中关键字的索引。这样所有的关键字的查找都会走一条从根结点到叶子结点的路径。所有的关键字查询长度都是相同的,查询效率相当。
四、B树与B+树操作(建议大家找张纸,跟着一起,毕竟知识是自己的)
1.B树
1.1 B树的插入
B树的插入是指插入一条记录,如果B树已存在需要插入的键值时,用新的值替换旧的值;若B树不存在这个值时,则是在叶子结点进行插入操作。
对高度为h的m阶B树,新结点一般插第h层。通过检索可以确定关键码应插入的位置,
1)若该结点中关键码个数小于等于m-1,则直接插入就可
2)若该结点中关键码个数等于m-1,则将引起结点的分裂,以中间的关键码为界将结点一分为二,产生了一个新的结点,并将中间关键码插入到父结点中;
重复上述过程,最坏情况一直分裂到根结点, 建立一个新的根结点,整个B树就增加一层。
举例如下:
》〉》〉下面以5阶B树举例,根据B树的定义,结点最多有4个值,最少有2个值。
a)在空树插入39,此时就有一个值,根结点也是叶子结点
b)继续插入22,97和41值,根结点变为4个值,符合要求
c)插入53值
插入之后发现超过结点最多只有4个值,所以要以中间值进行分开,分开后当前结点要指向父结点,分裂之后,发现符合要求
d)插入13,21,40,同样造成分裂,
e)紧接着插入30,27,33,36,24,34,35
f)将26再次插入进去
发现有5个值,超过B树的定义,需要以27为中心分裂,27进军父结点
发现父结点也超过4个,再次分裂
g)最后插入17,28,29,31,32的记录
1.2 B树的删除
B树删除:首先要查找该值是否在B树中存在,如果存在,判断该元素是否存在左右孩子结点,如果有,则上移孩子结点中的相近结点(左孩子最右边的结点或者有孩子最左边的结点)到父结点中,然后根据移动之后的情况;如果没有,进行直接删除;如果不存在对应的值,则删除失败。
1)如果当前要删除的值位于非叶子结点,则用后继值覆盖要删除的值,再用后继值所在的分支删除该后继值。(该后继值必须位于叶子结点上)
2)该结点值个数不小于Math.ceil(m/2)-1(取上线函数),结束删除操作,否则下一步
3)如果兄弟结点值个数大于Math.ceil(m/2)-1,则父结点中下移到该结点,兄弟的一个值上移,删除操作结束。
将父结点的key下移与当前的结点和他的兄弟姐妹结点key合并,形成一个新的结点,
有些结点可能有左兄弟,也有右兄弟,我们可以任意选择一个兄弟结点即可。
》〉》〉下面以5阶B树举例进行删除,根据B树的定义,结点最多有4个值,最少有2个值。
a)原始状态
b)在上面的B树删除21,删除之后结点个数大于等于2,所以删除结束
c)删除27之后为
27处于非叶子结点,用27的后继替换。也即是28替换27,然后在右孩子结点删除28,如上。
发现删除,当前叶子结点的记录的个数已经小于2,而兄弟结点中有3个记录我们可以从兄弟结点中借取一个key,父结点中的28就下移,兄弟结点中的26就上移,删除结束,结果如下
d)删除32
删除之后发现,当前结点中有key,而兄弟都有两个key,所以只能让父结点的30下移到和孩子一起合并,成为新的结点,并指向父结点,经拆封发现符合要求
2.B+树
2.1 B+树的插入
B+树插入:
1)若为空树,直接插入,此时也就是根结点
2)对于叶子结点:根据key找叶子结点,对叶子结点进行插入操作。插入后,如果当前结点key的个数不大于m-1,则插入就结束。反之将这个叶子结点分成左右两个叶子结点进行操作,左叶子结点包含了前m/2个记录,右结点包含剩下的记录key,将第m/2+1个记录的key进位到父结点中(父结点必须是索引类型结点),进位到父结点中的key左孩子指针向左结点,右孩子指针向右结点。
3)针对索引结点:如果当前结点key的个数小于等于m-1,插入结束。反之将这个索引类型结点分成两个索引结点,左索引结点包含前(m-1)/2个数据,右结点包含m-(m-1)/2个数据,然后将第m/2个key父结点中,进位到父结点的key左孩子指向左结点, 父结点的key右孩子指向右结点。
》〉》〉下面以5阶B+树举例进行插入,根据B+树的定义,结点最多有4个值,最少有2个值。
a)空树插入5,8,10,15
b)插入16
超过了最大值4,所以分裂,以中间为准
c)插入17,18
结点的关键字等于5,大于4,进行分裂。
符合条件,插入完成。
2.2 B+树删除
》〉》〉下面以5阶B+树举例进行删除,根据B+树的定义,结点最多有4个值,最少有2个值。
下面是初始状态
a)删除22,删除后个数为2,删除结束
b)删除15,结果如下:
删除之后,只有一个值,而兄弟有三个值,所以从兄弟结点借一个关键字,并更新索引结点
大家可以考虑删除7.我在这里直接给出结果
以上就是B树和B+树的操作,建议大家拿支笔操作一下,毕竟提高能力是没有错的。
五、代码实现
//测试程序1 #include <iostream> #include <cstdlib> #include <ctime> #include "BTree.h" using namespace std; int main() { char iKey[] = {'C','N','G','A','H','E','K','Q','M','F','W','L','T','Z','D','P','R','X','Y','S'}; char dKey[] = {'C','N','G','A','H','E','K','Q','M','F','W','L','T','Z','D','P','R','X','Y','S'}; int iSize = sizeof(iKey)/sizeof(char); int dSize = sizeof(dKey)/sizeof(char); int i; BTree<char> btree(5, NULL); cout<<"----------插入测试----------"<<endl; for(i = 0; i < iSize; i++) //插入测试 { cout<<"插入"<<iKey[i]<<"以后"<<endl; btree.Insert(iKey[i]); btree.PrintBTree(); } cout<<"----------删除测试----------"<<endl; for(i = 0; i < dSize; i++) //删除测试 { cout<<"删除"<<dKey[i]<<"以后"<<endl; btree.Delete(dKey[i]); btree.PrintBTree(); } return 0;
}
//测试程序2 #include <iostream> #include <cstdlib> #include <ctime> #include "BTree.h" using namespace std; int main() { srand((int)time(0)); const int iSize = 100000; //插入次数 const int dSize = 100000; //删除次数 const int num = 100; //测试组数 int *iKey = new int[iSize]; int *dKey = new int[dSize]; int i, j; for(j = 0; j < num; j++) //测试组数,每次测试都是插入iSize次,删除dSize次 { for(i = 0; i < iSize; i++) //插入数据生成 iKey[i] = rand()%iSize; for(i = 0; i < dSize; i++) dKey[i] = rand()%iSize; //删除数据生成 int m = rand()%400 + 3; //随机生成3阶到402阶 BTree<int> btree(m, NULL); cout<<"----------第"<<j<<"组插入测试----------"<<endl; for(i = 0; i < iSize; i++) //插入测试 btree.Insert(iKey[i]); cout<<"第"<<j<<"组插入测试成功,为"<<m<<"阶B树"<<endl; cout<<"----------第"<<j<<"组删除测试----------"<<endl; for(i = 0; i < dSize; i++) //删除测试 btree.Delete(dKey[i]); cout<<"第"<<j<<"组删除测试成功,为"<<m<<"阶B树"<<endl<<endl; } delete [] iKey; delete [] dKey; return 0; }
1 //BTree.h文件,由于使用了模板所以没法将声明与实现分离 2 #pragma once 3 #include <queue> 4 using namespace std; 5 6 //B树的结点定义 7 template <typename T> 8 struct BTreeNode 9 { 10 int num; //关键字个数 11 T *K; //指向关键字数组 12 BTreeNode<T> *parent; //指向父亲结点 13 BTreeNode<T> **A; //指向孩子结点数组的指针 14 BTreeNode(int n, int m, BTreeNode<T> *p) 15 { 16 num = n; 17 parent = p; 18 K = new T[m+1]; //最多有m-1个关键字,K0不用,Km用来当哨兵 19 A = new BTreeNode *[m+1]; //最多有m个分支,Am用来当哨兵 20 for(int i = 0; i <= m; i++) 21 A[i] = NULL; 22 } 23 ~BTreeNode() 24 { 25 delete [] K; K = NULL; 26 delete [] A; A = NULL; 27 } 28 }; 29 30 //搜索结果的三元组定义 31 template <typename T> 32 struct Triple 33 { 34 BTreeNode<T> * node; //关键字所在结点 35 int i; //关键字下标位置 36 bool tag; //搜索是否成功 37 Triple(BTreeNode<T> *nd, int pos, bool t) 38 { node = nd; i = pos; tag = t;} 39 }; 40 41 //B树定义 42 template <typename T> 43 class BTree 44 { 45 public: 46 BTree(); 47 BTree(int m , BTreeNode<T> * root); 48 ~BTree(); 49 Triple<T> Search(const T& x); //搜索核心函数 50 bool Insert(const T& x); //插入核心函数 51 bool Delete(const T& x); //删除核心函数 52 void InsertKey(BTreeNode<T> *p, T k, BTreeNode<T> *a, int i); //插入一个二元组(K,A) 53 void SpliteNode(BTreeNode<T> *p, T *k, BTreeNode<T> **a, int i); //分裂结点 54 void RightAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i); //从右子女取关键字 55 void LeftAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i); //从左子女取关键字 56 void LeftCompress(BTreeNode<T> *p, int i); //往左移动1个位置 57 void RightCompress(BTreeNode<T> *p, int i); //往右移动1个位置 58 void MergeNode(BTreeNode<T> *p, BTreeNode<T> *q, BTreeNode<T> *pR, int i); //合并两个结点 59 void PrintBTree(); //打印B树 60 private: 61 int m_m; //路数,即最大子树棵数 62 BTreeNode<T> *m_pRoot; //B树的根结点 63 }; 64 template<typename T> 65 BTree<T>::BTree() //默认构造函数 66 { 67 m_m = 5; //默认是5阶 68 m_pRoot = NULL; //根结点初始为空 69 } 70 template<typename T> 71 BTree<T>::BTree(int m , BTreeNode<T> * root) 72 { 73 m_m = m; 74 m_pRoot = root; 75 } 76 template<typename T> 77 BTree<T>::~BTree() //释放所有的空间 78 { 79 if(m_pRoot != NULL) 80 { 81 queue<BTreeNode<T> *> nodeQueue; //利用队列,按层次遍历B树 82 nodeQueue.push(m_pRoot); //放入根结点 83 while(nodeQueue.size()) 84 { 85 BTreeNode<T> * p = nodeQueue.front(); 86 if(p->A[0] != NULL) //不是叶结点,需考虑子女结点的删除 87 { 88 for(int i = 0; i <= p->num; i++) 89 nodeQueue.push(p->A[i]); 90 } 91 nodeQueue.pop(); 92 delete p; 93 p = NULL; 94 } 95 } 96 } 97 //函数功能: 查找关键字x是否在B树中 98 //函数参数: x为查找的关键字 99 //返回值: 一个Triple对象(node, i, tag),tag=true表示x等于结点r中的Ki;tag=false表示x不在树中,r是最后一个被搜索的结点 100 template <typename T> 101 Triple<T> BTree<T>::Search(const T &x) 102 { 103 int i = 0; //下标 104 BTreeNode<T> *p = m_pRoot, *q = NULL; //用来保存当前结点和它的父结点 105 106 while(p != NULL) //一直检查到叶结点 107 { 108 //n, A0,(K1, A1), (K2, A2), ... (Kn, An) 109 //确定i,使得Ki <= x < Ki+1,K[0]不放数据 110 //下面这条语句当然也可以写成 for(i = 1; i <= n && x >= p->K[i]; i++) 111 //但是为了与Ki <= x < Ki+1这个关系式统一,采用了下述写法,观察后面的程序,发现这样写还避免了下标溢出的判断 112 int n = p->num; //当前结点的关键字个数 113 for(i = 0; i < n && x >= p->K[i+1]; i++) //可以改进一下,用二分查找 114 ; 115 if(x == p->K[i]) //是否已找到,不用判断下标,i最大为n 116 return Triple<T>(p, i, true); 117 q = p; 118 p = p->A[i]; //搜索下一层,Ki与Ki+1中间的指针 119 } 120 return Triple<T>(q, i, false); //x不在树中,找到了可以插入的结点位置 121 } 122 //函数功能: 插入关键字x到B树中 123 //函数参数: x为插入的关键字 124 //返回值: 插入是否成功 125 template <typename T> 126 bool BTree<T>::Insert(const T &x) 127 { 128 if(m_pRoot == NULL) //空树 129 { 130 m_pRoot = new BTreeNode<T>(1, m_m, NULL); //新的根含有1个关键字 131 m_pRoot->K[1] = x; //根的关键字 132 return true; 133 } 134 135 Triple<T> triple = Search(x); //检查是否已存在 136 if(triple.tag == true) //x已在B树中 137 return false; 138 139 BTreeNode<T> *p = triple.node, *q; //结点地址 140 //构造插入的两元组(k,a) 其中k为关键字,a为右邻指针 141 BTreeNode<T> *a = NULL; 142 T k = x; 143 int i = triple.i; 144 145 while(1) //插入过程 146 { 147 if(p->num < m_m-1) //关键字个数未到达上限,可以直接插入 148 { 149 InsertKey(p, k, a, i); //(k, a)插入到位置(Ki, Ai)后面 150 return true; 151 } 152 SpliteNode(p, &k, &a, i); //将p结点分裂成两个结点,一个结点仍为p,另外一个变为两元组(k,a),以便插入到父结点 153 if(p->parent != NULL) //父结点不为空 154 { 155 q = p->parent; //获得父结点 156 for(i = 0; i < q->num && x >= q->K[i+1]; i++) //确定新的插入位置i 157 ; 158 p = q; //进入上一层 159 } 160 else 161 { 162 //已经到达了根,需要新建一个结点 163 m_pRoot = new BTreeNode<T>(1, m_m, NULL); //新的根含有1个关键字 164 m_pRoot->K[1] = k; //新根的关键字 165 m_pRoot->A[0] = p; //左指针 166 m_pRoot->A[1] = a; //右指针 167 p->parent = a->parent = m_pRoot; //更新左右指针的父结点 168 return true; 169 } 170 } 171 } 172 //函数功能: 插入关键字x到B树中,这是实际的插入函数 173 //函数参数: p指向插入关键字所在结点,k为插入的关键字,a为关键字的右邻,i为插入位置 174 //返回值: 无 175 template <typename T> 176 void BTree<T>::InsertKey(BTreeNode<T> *p, T k, BTreeNode<T> *a, int i) 177 { 178 for(int j = p->num; j > i; j--) //将K[i],A[i]以后的元素都往后移一个位置 179 { 180 p->K[j + 1] = p->K[j]; 181 p->A[j + 1] = p->A[j]; 182 } 183 p->num++; //结点的关键字个数加1 184 p->K[i + 1] = k; //插入两元组在K[i],A[i]以后 185 p->A[i + 1] = a; 186 if(a != NULL) //若为为空,需更新父结点指针 187 a->parent = p; 188 } 189 //函数功能: 分裂结点 190 //函数参数: p指向要分裂的结点,k指向插入的关键字,a指向关键字的右邻,i为插入位置 191 //返回值: 无 192 template <typename T> 193 void BTree<T>::SpliteNode(BTreeNode<T> *p, T *k, BTreeNode<T> **a, int i) 194 { 195 InsertKey(p, *k, *a, i); //先插了再说 196 int mid = (m_m + 1)/2; //[ceil(m/2)] 197 int size = (m_m & 1)? mid : mid + 1; //奇偶性决定了分裂时拷贝的关键字个数 198 199 BTreeNode<T> *q = new BTreeNode<T>(0, m_m, p->parent); //新结点 200 //将p的K[mid+1...m]和A[mid..m]移到q的K[1...mid-1]和A[0...mid-1] 201 q->A[0] = p->A[mid]; 202 for(int j = 1; j < size; j++) 203 { 204 q->K[j] = p->K[mid + j]; 205 q->A[j] = p->A[mid + j]; 206 } 207 //修改q中的子女的父结点为q,这里很重要,因为这些子女原来的父结点为p 208 if(q->A[0] != NULL) 209 { 210 for(int j = 0; j < size; j++) 211 q->A[j]->parent = q; 212 } 213 //更新结点的关键字个数 214 q->num = m_m - mid; //结点q:m –[ceil(m/2)], A[ceil(m/2)],(K [ceil(m/2)]+1, A [ceil(m/2)]+1), …, (Km, Am) 215 p->num = mid - 1; //结点p:[ceil(m/2)]–1, A0, (K1, A1), (K2,A2), …, (K[ceil(m/2)]–1, A[ceil(m/2)]–1) 216 //构建新的两元组(k,a) 217 *k = p->K[mid]; 218 *a = q; 219 } 220 221 //函数功能: 删除关键字x 222 //函数参数: x为要删除的关键字 223 //返回值: 删除是否成功 224 template <typename T> 225 bool BTree<T>::Delete(const T& x) 226 { 227 Triple<T> triple = Search(x); //检查是否已存在 228 if(triple.tag == false) //x不在B树中 229 return false; 230 BTreeNode<T> *p = triple.node, *q; //要删除的关键字所在结点 231 int i = triple.i; 232 233 if(p->A[i] != NULL) //非叶结点 234 { 235 q = p->A[i]; //找右子树的最小关键码 236 while(q->A[0] != NULL) 237 q = q->A[0]; 238 p->K[i] = q->K[1]; //用叶结点替换 239 LeftCompress(q, 1); //删除K[1],其实只是用后面的结点覆盖一下即可 240 p = q; //转换为叶结点的删除 241 } 242 else 243 LeftCompress(p, i); //叶结点直接删除,其实只是用后面的结点覆盖一下即可 244 245 int mid = (m_m + 1) / 2; //求[ceil(m/2)] 246 //下面开始调整 247 while(1) 248 { 249 if(p == m_pRoot || p->num >= mid-1) //情形1和情形2 250 break; 251 else 252 { 253 q = p->parent; //父亲结点 254 for(i = 0; i <= q->num && q->A[i] != p; i++) //找到p在父结点中的位置Ai 255 ; 256 if(i == 0) //p为最左指针 257 RightAdjust(p, q, i); //结点p、父结点q、p的右兄弟结点进行旋转调整 258 else 259 LeftAdjust(p, q, i); //结点p、父结点q、p的左兄弟结点进行旋转调整 260 p = q; //向上调整 261 } 262 } 263 if(m_pRoot->num == 0) //一颗空树 264 { 265 p = m_pRoot->A[0]; 266 delete m_pRoot; 267 m_pRoot = p; 268 if(m_pRoot != NULL) 269 m_pRoot->parent = NULL; 270 } 271 return true; 272 } 273 //函数功能: 通过右子女调整,如果右子女有多余结点,从右子女取一个关键字 274 //函数参数: p指向被删除的关键字所在结点,q指向父结点,i为p在q中的位置 275 //返回值: 无 276 template <typename T> 277 void BTree<T>::RightAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i) 278 { 279 BTreeNode<T> *pR = q->A[i+1]; //p的右兄弟 280 if(pR->num >= (m_m+1)/2) //情形3,兄弟有足够多的关键字,即至少还有[ceil(m/2)] 281 { 282 //调整p 283 p->num++; //p的关键字个数加1 284 p->K[p->num] = q->K[i+1]; //父结点相应关键码下移 285 p->A[p->num] = pR->A[0]; //右兄弟最左指针移到p的最右 286 if(p->A[p->num] != NULL) 287 p->A[p->num]->parent = p; //修改父结点,原来是pR 288 //调整父结点 289 q->K[i+1] = pR->K[1]; //右兄弟的最小关键码上移到父结点 290 //调整右兄弟 291 pR->A[0] = pR->A[1]; //右兄弟剩余关键字与指针前移 292 LeftCompress(pR, 1); //覆盖K[1],A[1],关键字个数减1,LeftCompress中自动会减1 293 } 294 else 295 MergeNode(p, q, pR, i + 1);//情形4 (...p Ki+1 pR...) 296 } 297 //函数功能: 通过左子女调整,如果左子女有多余结点,从左子女取一个关键字 298 //函数参数: p指向被删除的关键字所在结点,q指向父结点,i为p在q中的位置 299 //返回值: 无 300 template <typename T> 301 void BTree<T>::LeftAdjust(BTreeNode<T> *p, BTreeNode<T> *q, int i) 302 { 303 BTreeNode<T> *pL = q->A[i-1]; //p的左兄弟 304 if(pL->num >= (m_m+1)/2) //情形3 305 { 306 //调整p 307 RightCompress(p, 1); //p的关键字和指针往右移动,空出位置放左子女的关键字,RightCompress会自动加1 308 p->A[1] = p->A[0]; 309 p->K[1] = q->K[i]; //父结点相应关键码下移 310 p->A[0] = pL->A[pL->num]; //左兄弟最右指针移到p的最左 311 if(p->A[0] != NULL) 312 p->A[0]->parent = p; //修改父结点,原来是pL 313 //调整父结点 314 q->K[i] = pL->K[pL->num]; //左兄弟的最大关键码上移到父结点 315 //调整左兄弟 316 pL->num--; //左兄弟的关键字个数减1 317 } 318 else 319 { 320 //左右互换一下,以符合合并函数的参数要求 321 BTreeNode<T> *pR = p; 322 p = pL; 323 MergeNode(p, q, pR, i); //情形4,注意这里i,而不是i+1 (...p Ki pR...) 324 } 325 } 326 //函数功能: 将结点p自i+1开始的关键字和指针往左移动1,原来的K[i],A[i]其实被覆盖掉了 327 //函数参数: p指向结点,i为被覆盖的位置 328 //返回值: 无 329 template <typename T> 330 void BTree<T>::LeftCompress(BTreeNode<T> *p, int i) 331 { 332 int n = p->num; //结点关键字个数 333 for(int j = i; j < n; j++) 334 { 335 p->K[j] = p->K[j + 1]; 336 p->A[j] = p->A[j + 1]; 337 } 338 p->num--; //关键字个数减1 339 } 340 //函数功能: 将结点p自i开始的关键字和指针往右移动1,原来的K[i],A[i]空出来了 341 //函数参数: p指向结点,i为空出来的位置,用于放新的关键字 342 //返回值: 无 343 template <typename T> 344 void BTree<T>::RightCompress(BTreeNode<T> *p, int i) 345 { 346 for(int j = p->num; j >= i; j--) //K[i],A[i]空出来用以放插入的二元组 347 { 348 p->K[j + 1] = p->K[j]; 349 p->A[j + 1] = p->A[j]; 350 } 351 p->num++; //关键字个数加1 352 } 353 //函数功能: 合并两个结点 354 //函数参数: p指向结点,q指向父亲,pR指向p的右兄弟,i为(...p,K,pR...)中的K位置 355 //返回值: 无 356 template <typename T> 357 void BTree<T>::MergeNode(BTreeNode<T> *p, BTreeNode<T> *q, BTreeNode<T> *pR, int i) 358 { 359 int n = p->num + 1; //p结点下一个放关键字的位置 360 p->K[n] = q->K[i]; //下降父结点的关键字 361 p->A[n] = pR->A[0]; //从右兄弟左移一个指针 362 for(int j = 1; j <= pR->num; j++) //将右兄弟剩余关键字和指针移到p中 363 { 364 p->K[n + j] = pR->K[j]; 365 p->A[n + j] = pR->A[j]; 366 } 367 if(p->A[0]) //修改p中的子女的父结点为p,这里很重要,因为这些子女原来的父结点为pR,与分裂相对 368 { 369 for(int j = 0; j <= pR->num; j++) 370 p->A[n + j]->parent = p; 371 } 372 LeftCompress(q, i); //父结点的关键字个数减1 373 p->num = p->num + pR->num + 1; //合并后关键字的个数 374 delete pR; 375 pR = NULL; 376 } 377 //函数功能: 打印B树 378 //函数参数: 无 379 //返回值: 无 380 template <typename T> 381 void BTree<T>::PrintBTree() 382 { 383 if(m_pRoot != NULL) 384 { 385 queue<BTreeNode<T> *> nodeQueue; //利用队列 386 nodeQueue.push(m_pRoot); //放入根结点 387 while(nodeQueue.size()) 388 { 389 BTreeNode<T> * p = nodeQueue.front(); 390 if(p->A[0] != NULL) //非叶结点 391 { 392 nodeQueue.push(p->A[0]); //将子女结点的指针放入队列中 393 for(int i = 1; i <= p->num; i++) 394 { 395 nodeQueue.push(p->A[i]); 396 cout<<p->K[i]<<' '; 397 } 398 } 399 else 400 { 401 for(int i = 1; i <= p->num; i++) 402 cout<<p->K[i]<<' '; 403 } 404 405 if(p->parent) //打印父结点的第一个关键字 406 cout<<"-----First key of their parent:"<<p->parent->K[1]<<endl; 407 else 408 cout<<endl; 409 nodeQueue.pop(); 410 } 411 } 412 }
可以直接运行,大家可以复制粘贴进行效果查看(算法思想很重要)
上面就是B树和B+树从概念到代码应用,B树从数据库引出的,讲完之后,也会重回数据库。下一篇将继续讲解针对SQLite进行封装的FMDB第三方的讲解并附带项目中实际使用。
欢迎大家指正。