[STL源码剖析]RB-tree的插入操作

RB-tree的性质

对于RB-tree,首先做一个了解,先看一张维基百科的RB-tree:

再看RB-tree的性质:

性质1. 节点是红色或黑色。

性质2. 根是黑色,所有叶子都是黑色(叶子节点指的是NIL节点)。。

性质3. 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)

性质4. 从任一节点到其每个叶子的所有简单路径 都包含相同数目的黑色节点。

二查搜索树的插入删除操作

在展开红黑树之前, 首先来看看普通二叉搜索树的插入和删除. 插入很容易理解, 比当前值大就往右走, 比当前值小就往左走。

这里详细展开的是删除操作:

二叉树的删除操作有一个技巧, 即在查找到需要删除的节点 X;

接着我们找到要么在它的左子树中的最大元素节点 M、要么在它的右子树中的最小元素节点 M, 并交换(M,X). 此时, M 节点必然至多只有一个孩子;

最后一个步骤就是用 M 的子节点代替 M 节点就完成了。

所以, 所有的删除操作最后都会归结为删除一个至多只有一个孩子的节点, 而我们删除这个节点后, 用它的孩子替换就好了. 将会看到 sgi stl map 就是这样的策略.

在红黑树删除操作讲解中, 我们假设代替 M 的节点是 N(下面的讲述不再出现 M).

RB-tree的插入操作

插入新节点总是红色节点, 因为不会破坏性质 5, 尽可能维持所有性质.

假设, 新插入的节点为 N, N 节点的父节点为 P, P 的兄弟(N 的叔父)节点为 U, P 的父亲(N 的爷爷)节点为 G. 所以有如下的印象图:

插入节点的关键是:

插入新节点总是红色节点
如果插入节点的父节点是黑色, 能维持性质
如果插入节点的父节点是红色, 破坏了性质. 故插入算法就是通过重新着色或旋转, 来维持性质

插入算法详解如下, 走一遍红黑树维持其性质的过程:

第 0.0 种情况, N 为根节点, 直接 N->黑. over
第 0.1 种情况, N 的父节点为黑色, 这不违反红黑树的五种性质. over

第 1 种情况, N,P,U 都红(G 肯定黑). 策略: G->红, N,P->黑. 此时, G 红, 如果 G 的父亲也是红, 性质又被破坏了, 这时,可以将 GPUN 看成一个新的红色 N 节点, 如此递归调整下去; 特殊的, 如果碰巧将根节点染成了红色, 可以在算法的最后强制 root->黑.

第 2 种情况, P 为红, N 为 P 右孩子, N 为红, U 为黑或缺少. 策略: 旋转变换, 从而进入下一种情况:(分N在P的左边还是右边)

第 3 种情况, 可能由第二种变化而来, 但不是一定: P 为红, N 为 P 左孩子, N 为红. 策略: 旋转, 交换 P,G 颜色, 调整后, 因为 P 为黑色, 所以不怕 P 的父节点是红色的情况. over

红黑树的插入就为上面的三种情况. 你可以做镜像变换从而得到其他的情况.


从代码实现的角度分析:

要真正理解红黑树的插入,还得先理解二叉查找树的插入。磨刀不误砍柴工,咱们再来了解一下二叉查找树的插入和红黑树的插入。如果要在二叉查找树中插入一个结点,首先要查找到结点要插入的位置,然后进行插入。假设插入的结点为z的话,插入的伪代码如下:

tree_insert(T, z)
	y = NULL
	x = T
	while(x != NULL)
		y = x
		if(z->key < x->key)
			x = x->left
		else 
			x = x->right
	end while
	
	z->parent = y;
	
	if(y == NULL)
		T = z
	else if(z->key < y->key)
		y->left = z
	else 
		y->right = z

红黑树的插入和插入修复

现在我们了解了二叉查找树的插入,接下来,咱们便来具体了解下红黑树的插入操作。红黑树的插入相当于在二叉查找树插入的基础上,为了重新恢复平衡,继续做了插入修复操作。

假设插入的结点为z,红黑树的插入伪代码具体如下所示:

rb_tree_insert
	y = NULL
	x = T
	while(x != NIL)
		if(x->key < z->key)
			x = x->right
		else
			x = x->left
	end while
	
	z->parent = y
	
	if(y == NULL)
		T = z
	else if(z->key < x->key)
		y->left = z
	else
		y->right = z
	
	z->left = NIL
	z->right = NIL
	z->color = RED
	rb_tree_insert_fix(T, z)
	
end rb_tree_insert

把上面这段红黑树的插入代码,跟之前看到的二叉查找树的插入代码比较一下可以看出,RB-INSERT(T, z)前面的第1~13行代码基本上就是二叉查找树的插入代码,然后第14~16行代码把z的左孩子和右孩子都赋为叶结点nil,再把z结点着为红色,最后为保证红黑性质在插入操作后依然保持,调用一个辅助程rb_tree_insert_fix来对结点进行重新着色,并旋转。


 下面紧接着调整程序:

换言之,如果插入的是根结点,由于原树是空树,此情况只会违反rb_tree根节点是黑色的这一个性质,因此直接把此结点涂为黑色;如果插入的结点的父结点是黑色,由于此不会违反rb_tree性质,红黑树没有被破坏,所以此时什么也不做。

但当遇到下述3种情况时又该如何调整呢?

● 插入修复情况1:如果当前结点的父结点是红色且祖父结点的另一个子结点(叔叔结点)是红色

● 插入修复情况2:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的右子

● 插入修复情况3:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的左子

答案就是根据红黑树插入代码RB-INSERT(T, z)最后一行调用的RB-INSERT-FIX(T, z)函数所示的步骤进行操作,具体如下所示:

//循环递归调整
rb_tree_insert_fix(T, z)
while(z->parent->color == RED)
	if(z->parent == z->parent->parent->left)//父节点是祖父节点的左孩子
		y = z->parent->parent->right//y是z的叔叔
		if(y->color == RED)//红色叔叔
			z->parent->color = BLACK
			y->color = BLACK
			z->parent->parent->color = RED
			z = z->parent->parent
		else if(z = z->parent->right)//黑色叔叔
			z = z->parent
			L_rotate(T, z)
		else
			z->parent->color = BLACK//这里会退出while循环
			z->parent->parent->color = RED
			R_Rotate(T, z->parent->parent)
	else
		//把rb_tree做对称处理
end while
T->color = BLACK
end rb_tree_insert_fix

下面,咱们来分别处理上述3种插入修复情况。

插入修复情况1:当前结点的父结点是红色,祖父结点的另一个子结点(叔叔结点)是红色(这时的祖父节点一定是黑色的)。

此时父结点的父结点一定存在,否则插入前就已不是红黑树。与此同时,又分为父结点是祖父结点的左孩子还是右孩子,根据对称性,我们只要解开一个方向就可以了。这里只考虑父结点为祖父左孩子的情况,如下图所示。

对此,我们的解决策略是:将当前节点的父节点和叔叔节点涂黑,祖父结点涂红,把当前结点指向祖父节点,从新的当前节点重新开始算法。即如下代码所示:

如下代码:

//循环递归调整
while(z->parent->color == RED)
	if(z->parent == z->parent->parent->left)//父节点是祖父节点的左孩子
		y = z->parent->parent->right//y是z的叔叔
		if(y->color == RED)//红色叔叔
			z->parent->color = BLACK
			y->color = BLACK
			z->parent->parent->color = RED
			z = z->parent->parent
			
		
		

所以,变化后如下图所示:

于是,插入修复情况1转换成了插入修复情况2。

插入修复情况2:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的右子

此时,解决对策是:当前节点的父节点做为新的当前节点,以新当前节点为支点左旋。即如下代码所示:

else if(z = z->parent->right)//黑色叔叔
	z = z->parent
	L_rotate(T, z)

所以红黑树由之前的:

变化成:

从而插入修复情况2转换成了插入修复情况3。

插入修复情况3:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的左孩子

解决对策是:父节点变为黑色,祖父节点变为红色,在祖父节点为支点右旋,操作代码为:

z->parent->color = BLACK
z->parent->parent->color = RED
R_Rotate(T, z->parent->parent)

最后,把根结点涂为黑色,整棵红黑树便重新恢复了平衡。所以红黑树由之前的:

变化成:

总结:经过上面情况1、情况2、情况3等三种插入修复情况的操作示意图,读者自会发现,后面的情况2、情况3都是针对情况1插入节点4以后,进行的一系列插入修复情况操作,不过,指向当前节点N指针一直在变化。
所以,你可以想当然的认为:整个下来,情况1、2、3就是一个完整的插入修复情况的操作流程。

posted @ 2015-10-08 12:32  stemon  阅读(566)  评论(0编辑  收藏  举报