B+树 -- Java实现
一、B+树定义
B+树定义:关键字个数比孩子结点个数小1的树。
除此之外B+树还有以下的要求:
-
B+树包含2种类型的结点:内部结点(也称索引结点)和叶子结点。根结点本身即可以是内部结点,也可以是叶子结点。根结点的关键字个数最少可以只有1个。
-
B+树与B树最大的不同是内部结点不保存数据,只用于索引,所有数据(或者说记录)都保存在叶子结点中。
-
m阶B+树表示了内部结点最多有m-1个关键字(或者说内部结点最多有m个子树),阶数m同时限制了叶子结点最多存储m-1个记录。
-
内部结点中的key都按照从小到大的顺序排列,对于内部结点中的一个key,左树中的所有key都小于它,右子树中的key都大于等于它。叶子结点中的记录也按照key的大小排列。
-
每个叶子结点都存有相邻叶子结点的指针,叶子结点本身依关键字的大小自小而大顺序链接。
二、B+树的插入操作
1)若为空树,创建一个叶子结点,然后将记录插入其中,此时这个叶子结点也是根结点,插入操作结束。
2)针对叶子类型结点:根据key值找到叶子结点,向这个叶子结点插入记录。插入后,若当前结点key的个数小于等于m-1,则插入结束。否则将这个叶子结点分裂成左右两个叶子结点,左叶子结点包含前m/2个记录,右结点包含剩下的记录,将第m/2+1个记录的key进位到父结点中(父结点一定是索引类型结点),进位到父结点的key左孩子指针向左结点,右孩子指针向右结点。将当前结点的指针指向父结点,然后执行第3步。
3)针对索引类型结点:若当前结点key的个数小于等于m-1,则插入结束。否则,将这个索引类型结点分裂成两个索引结点,左索引结点包含前(m-1)/2个key,右结点包含m-(m-1)/2个key,将第m/2个key进位到父结点中,进位到父结点的key左孩子指向左结点, 进位到父结点的key右孩子指向右结点。将当前结点的指针指向父结点,然后重复第3步。
下面是一颗5阶B树的插入过程,5阶B数的结点最少2个key,最多4个key。
a)空树中插入5
b)依次插入8,10,15
c)插入16
插入16后超过了关键字的个数限制,所以要进行分裂。在叶子结点分裂时,分裂出来的左结点2个记录,右边3个记录,中间key成为索引结点中的key,分裂后当前结点指向了父结点(根结点)。结果如下图所示。
当然我们还有另一种分裂方式,给左结点3个记录,右结点2个记录,此时索引结点中的key就变为15。
d)插入17
e)插入18,插入后如下图所示
当前结点的关键字个数大于5,进行分裂。分裂成两个结点,左结点2个记录,右结点3个记录,关键字16进位到父结点(索引类型)中,将当前结点的指针指向父结点。
当前结点的关键字个数满足条件,插入结束
f)插入若干数据后
g)在上图中插入7,结果如下图所示
当前结点的关键字个数超过4,需要分裂。左结点2个记录,右结点3个记录。分裂后关键字7进入到父结点中,将当前结点的指针指向父结点,结果如下图所示。
当前结点的关键字个数超过4,需要继续分裂。左结点2个关键字,右结点2个关键字,关键字16进入到父结点中,将当前结点指向父结点,结果如下图所示。
当前结点的关键字个数满足条件,插入结束。
三、B+树的删除操作
如果叶子结点中没有相应的key,则删除失败。否则执行下面的步骤
1)删除叶子结点中对应的key。删除后若结点的key的个数大于等于Math.ceil(m-1)/2 – 1,删除操作结束,否则执行第2步。
2)若兄弟结点key有富余(大于Math.ceil(m-1)/2 – 1),向兄弟结点借一个记录,同时用借到的key替换父结(指当前结点和兄弟结点共同的父结点)点中的key,删除结束。否则执行第3步。
3)若兄弟结点中没有富余的key,则当前结点和兄弟结点合并成一个新的叶子结点,并删除父结点中的key(父结点中的这个key两边的孩子指针就变成了一个指针,正好指向这个新的叶子结点),将当前结点指向父结点(必为索引结点),执行第4步(第4步以后的操作和B树就完全一样了,主要是为了更新索引结点)。
4)若索引结点的key的个数大于等于Math.ceil(m-1)/2 – 1,则删除操作结束。否则执行第5步
5)若兄弟结点有富余,父结点key下移,兄弟结点key上移,删除结束。否则执行第6步
6)当前结点和兄弟结点及父结点下移key合并成一个新的结点。将当前结点指向父结点,重复第4步。
注意,通过B+树的删除操作后,索引结点中存在的key,不一定在叶子结点中存在对应的记录。
下面是一颗5阶B树的删除过程,5阶B数的结点最少2个key,最多4个key。
a)初始状态
b)删除22,删除后结果如下图
删除后叶子结点中key的个数大于等于2,删除结束
c)删除15,删除后的结果如下图所示
删除后当前结点只有一个key,不满足条件,而兄弟结点有三个key,可以从兄弟结点借一个关键字为9的记录,同时更新将父结点中的关键字由10也变为9,删除结束。
d)删除7,删除后的结果如下图所示
当前结点关键字个数小于2,(左)兄弟结点中的也没有富余的关键字(当前结点还有个右兄弟,不过选择任意一个进行分析就可以了,这里我们选择了左边的),所以当前结点和兄弟结点合并,并删除父结点中的key,当前结点指向父结点。
此时当前结点的关键字个数小于2,兄弟结点的关键字也没有富余,所以父结点中的关键字下移,和两个孩子结点合并,结果如下图所示。
四、Java代码实现
public class BTreeNode {
public BTreeNode parent;//父节点
/*以升序方式存储.*/
public List<Integer> keys;
/*孩子*/
public List<BTreeNode> children;
public boolean leaf;//是否是子节点
/*子节点中指向下一个节点.*/
public BTreeNode next;
public BTreeNode() {
keys = new ArrayList<>();
children = new ArrayList<>();
leaf = false;
}
/*返回关键字个数*/
public int size() {
return keys.size();
}
//该节点中存储的索引是否包含该key值,包含则返回当前索引值,否则返回小于key值的索引
public SearchResult searchKey(Integer key) {
int index = Collections.binarySearch(keys, key);
if (index >= 0) {
return new SearchResult(index, true);
} else {
return new SearchResult(Math.abs(index + 1), false);
}
}
//keys集合是升序排序,这里做了排序的动作,可以直接添加,然后对集合重新排序
public void addKey(Integer key) {
SearchResult searchResult = searchKey(key);
if (!searchResult.found) {
List<Integer> list = new ArrayList<>(size() + 1);
for (int i = 0; i < searchResult.index; i++) {
list.add(keys.get(i));
}
list.add(key);
for (int i = searchResult.index; i < keys.size(); i++) {
list.add(keys.get(i));
}
keys = list;
}
}
//从集合中移除索引
public void removeKey(Integer key) {
keys.remove(key);
}
//获取子孩子
public BTreeNode childAt(int index) {
if (leaf) {
throw new UnsupportedOperationException("Leaf node doesn't have children.");
} else {
return children.get(index);
}
}
//将子孩子添加到集合末尾
public void addChild(BTreeNode node) {
children.add(node);
}
public void removeChild(int index) {
children.remove(index);
}
//某个位置上的子孩子添加
public void addChild(BTreeNode child, int index) {
List<BTreeNode> newChildren = new ArrayList<>();
int i = 0;
for (; i < index; ++i) {
newChildren.add(children.get(i));
}
newChildren.add(child);
for (; i < children.size(); ++i) {
newChildren.add(children.get(i));
}
children = newChildren;
}
}
public class SearchResult {
public int index;//索引所在集合的位置
public boolean found;//是否找到索引
public SearchResult() {
}
public SearchResult(int index, boolean found) {
this.index = index;
this.found = found;
}
}
public class Result extends SearchResult {
public BTreeNode node;//当前节点,索引值没有找到,则为要插入的节点
public int parentIndex;//当前节点在父级节点的位置
public Result(BTreeNode node, int index, int parentIndex, boolean found) {
super(index, found);
this.node = node;
this.parentIndex = parentIndex;
}
public Result(BTreeNode node, int parentIndex, SearchResult searchResult) {
super(searchResult.index, searchResult.found);
this.node = node;
this.parentIndex = parentIndex;
}
}
上面的基本定义则描述了一个节点包括其索引集合,还包括其子孩子,并且在BTreeNode中封装了一些方法,供后续调用
public class BTree {
private static final int DEFAULT_T = 2;
public BTreeNode root;
/* 根据B树的定义,B树的每个非根节点的关键字数n满足(t - 1) <= n <= (2t - 1) */
private int t = DEFAULT_T;
/* 非根节点中最小的键值数 */
private int minKeySize;
/* 非根节点中最大的键值数 */
private int maxKeySize;
public BTree(int t /*传入b树的阶数*/) {
this();
this.t = t;
minKeySize = t / 2;
maxKeySize = t - 1;
}
}
封装方法,找到当前索引的位置,没有找到时,则返回索引所在的节点中集合的位置,
public Result searchLeafNode(BTreeNode node, int parentIndex, Integer key) {
SearchResult searchResult = node.searchKey(key);
if (node.leaf) {//子节点
return new Result(node, parentIndex, searchResult);
} else {
if (searchResult.found) {
searchResult.index++;
}
return searchLeafNode(node.children.get(searchResult.index), searchResult.index, key);
}
}
插入思路:
- 找到关键字的位置,找到该节点一定是子节点。
- 添加了关键字的节点,判断是否满了,满了则进行分裂
- 子节点分裂时,选取中间值上升为父节点中值,但不从子节点中移除,因为子节点保存关键字的值,非子节点保存仅仅是索引
public boolean insert(Integer key) {
// 找到子节点
Result result = searchLeafNode(root, 0, key);
if (result.found) {//找到该节点,不操作
return false;
}
BTreeNode node = result.node;
node.addKey(key);
//判断节点是否满了,满了则进行分割
if (isFull(node)) {
split(node.parent, result.parentIndex, node);
}
return true;
}
//进行分割
public void split(BTreeNode parentNode, int parentIndex, BTreeNode childNode) {
//将当前节点一份为二,小的部分将放入到新节点中,自身则成为右节点
int mid = childNode.size() / 2;
Integer key = null;
boolean unLeaf = childNode.children.isEmpty();
//判断是否为子节点,如果是子节点,索引会放入到右节点中,否则会放入到父节点中
if (unLeaf) {
key = childNode.keys.get(mid);
} else {
key = childNode.keys.remove(mid);
}
//分裂出左节点形成新的节点
List<Integer> keys = new ArrayList<>();
for (int i = 0; i < mid; i++) {
Integer k = childNode.keys.remove(0);
keys.add(k);
}
BTreeNode node = new BTreeNode();
node.parent = parentNode;
node.leaf = childNode.children.isEmpty();
node.keys.addAll(keys);
node.next = childNode;//节点下一个
//将孩子节点部分也移动到新节点中
if (!unLeaf) {
mid = childNode.children.size() / 2;
for (int i = 0; i < mid; i++) {
BTreeNode bTreeNode = childNode.children.remove(0);
bTreeNode.parent = node;
node.addChild(bTreeNode);
}
}
//父节点为空时,需要产生一个新节点
if (parentNode == null) {
root = new BTreeNode();
root.leaf = false;
parentNode = root;
childNode.parent = parentNode;
node.parent = parentNode;
parentNode.children.add(childNode);
}
int index = parentNode.addKey(key);
//前一个指针的下一个指针重新定向
BTreeNode preNode = parentNode.children.get(parentIndex);
preNode.next = node;
//将节点添加到列表中
parentNode.addChild(node, index);
if (isFull(parentNode)) {//父节点终索引是否满了,满了,则继续分裂
split(parentNode.parent, 0, parentNode);
}
}
private boolean isFull(BTreeNode node) {
return node.size() > maxKeySize;
}
删除关键字思路:
- 找到该节点,如果是为找到,直接返回
- 找到该节点,出现一定是在子节点中,移除掉后,判断子节点的索引值是否大于最小数,大于则返回,否则需要进行合并。移除的当前节点如果出现在父节点中,也需要移除。会从子节点中选择一个节点进行补充
- 删除后小于最小数,则先从兄弟节点借,如果兄弟节点借不出,则进行合并
- 子节点进行合并,不需要移动子孩子
- 父节点进行合并,需要将孩子节点移动
//删除节点
public boolean delete(Integer key) {
//找到该节点
Result result = searchLeafNode(root, 0, key);
if (!result.found) {//未找到
return false;
}
//删除的节点数量大于
BTreeNode node = result.node;
node.removeKey(key);
if (node.keys.size() >= minKeySize) {
if (node.parent.keys.contains(key)) {//父节点中包含该节点
Integer min = node.keys.get(0);
node.parent.removeKey(key);
node.parent.addKey(min);
}
return true;
}
//删除节点后,不满足情况,则找兄弟节点借
BTreeNode parent = node.parent;
if (result.parentIndex != 0 && parent.children.get(result.parentIndex - 1).keys.size() > minKeySize) {//左节点有富余可以借
BTreeNode left = parent.children.get(result.parentIndex - 1);
Integer max = left.keys.remove(left.keys.size() - 1);
//替换节点
if (parent.keys.contains(key)) {
parent.removeKey(key);
parent.addKey(max);
node.addKey(max);
} else {
Integer min = node.keys.get(0);
parent.removeKey(min);
parent.addKey(max);
node.addKey(max);
}
} else if (result.parentIndex < parent.children.size() - 1 && parent.children.get(result.parentIndex - 1).keys.size() > minKeySize) {//右节点有富余可以借
BTreeNode right = parent.children.get(result.parentIndex + 1);
Integer min = right.keys.remove(0);
//替换节点
if (parent.keys.contains(key)) {
parent.removeKey(key);
parent.addKey(min);
node.addKey(min);
} else {
Integer max = node.keys.get(node.keys.size() - 1);
parent.removeKey(max);
parent.addKey(min);
node.addKey(min);
}
} else {
//兄弟节点也没有,则进行合并
node.parent.removeKey(key);
node.parent.removeKey(node.keys.get(0));
union(node, result.parentIndex);
}
return true;
}
public void union(BTreeNode node, int parentIndex) {
int ch = 0;
if (parentIndex == 0) {//当前节点是最左节点,则只能找右节点
ch = 1;
} else {//否则找左节点
ch = parentIndex - 1;
}
BTreeNode parent = node.parent;
if (parent == null) {
return;
}
BTreeNode kNode = parent.children.get(ch);
for (int i = 0; i < node.size(); i++) {
kNode.addKey(node.keys.get(i));
}
parent.removeChild(parentIndex);//移除节点
//判断上级节点
if (parent.keys.size() < minKeySize) {
union(parent);
}
}
public void union(BTreeNode node) {
if (node.parent == null) {
return;
}
Integer min = node.keys.get(0);
BTreeNode parent = node.parent;
//找到当前节点的位置
Integer index = -1;
for (int i = parent.keys.size() - 1; i >= 0; i--) {
if (min > parent.keys.get(i)) {
index = i;
break;
}
}
Integer parentValue = null;
if (index != -1) {
parentValue = parent.keys.get(index);
} else {//没有找到则表示当前节点为最左节点
parentValue = parent.keys.get(index + 1);
}
if (index != -1 && parent.children.get(index).keys.size() > minKeySize) {
//判断左节点是否富余
BTreeNode left = parent.children.get(index);
Integer max = left.keys.get(left.size() - 1);
parent.keys.add(index, max);
node.addKey(parentValue);
node.addChild(left.children.get(left.children.size() - 1), 0);
} else if ((index == -1 && parent.children.get(index + 2).keys.size() > minKeySize) || (index < parent.keys.size() - 1 && parent.children.get(index + 1).keys.size() > minKeySize)) {
//判断右节点是否富余
BTreeNode right = parent.children.get(index + 1);
Integer m = right.keys.get(0);
parent.keys.add(index, m);
node.addKey(parentValue);
node.addChild(right.children.get(0));
} else {
//合并
if (index == -1) {
//合并到右节点
BTreeNode right = parent.children.get(index + 2);
Integer pa = parent.keys.remove(index + 1);
right.addKey(pa);
for (int i = 0; i < node.keys.size(); i++) {
right.addKey(node.keys.get(i));
}
List<BTreeNode> bTreeNodes = new ArrayList<>();
for (int i = 0; i < node.children.size(); i++) {
bTreeNodes.add(node.children.get(i));
}
for (int i = 0; i < right.children.size(); i++) {
bTreeNodes.add(right.children.get(i));
}
right.children = bTreeNodes;
parent.children.remove(index + 1);//移除该节点
if (parent.keys.isEmpty()) {//节点为空
root = right;
return;
}
} else {
//合并到左节点
//找到父级节点下沉,并将该节点所有添加到左节点中
BTreeNode left = parent.children.get(index);
Integer max = parent.keys.remove(index.intValue());
left.addKey(max);
for (int i = 0; i < node.keys.size(); i++) {
left.addKey(node.keys.get(i));
}
for (int i = 0; i < node.children.size(); i++) {
left.children.add(node.children.get(i));
}
parent.children.remove(index + 1);//移除该节点
if (parent.keys.isEmpty()) {//节点为空
root = left;
return;
}
}
}
//判断上级节点
if (parent.keys.size() < minKeySize) {
union(parent);
}
}
打印输出:
private void outPut(BTreeNode node, int index) {
if (node.leaf) {
List<Integer> kes = node.keys;
System.out.println("叶子节点,层级:" + index + ",keys:" + kes);
} else {
List<Integer> kes = node.keys;
System.out.println("层级:" + index + ",keys:" + kes);
for (int i = 0; i < node.children.size(); i++) {
outPut(node.children.get(i), index + 1);
}
}
}
public static void main(String[] args) {
BTree tree = new BTree(5);
tree.insert(5);
tree.insert(8);
tree.insert(10);
tree.insert(15);
tree.insert(16);
tree.insert(17);
tree.insert(6);
tree.insert(9);
tree.insert(18);
tree.insert(19);
tree.insert(20);
tree.insert(21);
tree.insert(22);
tree.insert(7);
tree.outPut(tree.root, 0);
System.out.println("---------------------------------------------");
tree.delete(22);
tree.delete(15);
tree.outPut(tree.root, 0);
System.out.println("---------------------------------------------");
tree.delete(7);
tree.outPut(tree.root, 0);
System.out.println("---------------------------------------------");
}
最后的结果:
层级:0,keys:[16]
层级:1,keys:[7, 10]
叶子节点,层级:2,keys:[5, 6]
叶子节点,层级:2,keys:[7, 8, 9]
叶子节点,层级:2,keys:[10, 15]
层级:1,keys:[18, 20]
叶子节点,层级:2,keys:[16, 17]
叶子节点,层级:2,keys:[18, 19]
叶子节点,层级:2,keys:[20, 21, 22]
---------------------------------------------
层级:0,keys:[16]
层级:1,keys:[7, 9]
叶子节点,层级:2,keys:[5, 6]
叶子节点,层级:2,keys:[7, 8]
叶子节点,层级:2,keys:[9, 10]
层级:1,keys:[18, 20]
叶子节点,层级:2,keys:[16, 17]
叶子节点,层级:2,keys:[18, 19]
叶子节点,层级:2,keys:[20, 21]
---------------------------------------------
层级:0,keys:[9, 16, 18, 20]
叶子节点,层级:1,keys:[5, 6, 8]
叶子节点,层级:1,keys:[9, 10]
叶子节点,层级:1,keys:[16, 17]
叶子节点,层级:1,keys:[18, 19]
叶子节点,层级:1,keys:[20, 21]