红黑树
红黑树是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组。红黑树和AVL树一样都对插入时间、删除时间和查找时间提供了最好可能的最坏情况担保。
红黑树是每个节点都带有颜色属性的二叉查找树,颜色为红色或黑色。在二叉查找树强制一般要求以外,对于任何有效的红黑树我们增加了如下的额外要求:
性质1. 节点是红色或黑色。
性质2. 根是黑色。
性质3. 所有叶子都是黑色(叶子是NIL节点)。
性质4. 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
性质5. 从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点。
以上的五个约束就为了一个目的:所有性质1-5合起来约束了该树的平衡性能--即该树上的最长路径不可能会大于2倍最短路径。为什么?因为第1条该树上的节点非红即黑,由于第4条该树上不允许存在两个连续的红节点,那么对于从一个节点到其叶子节点的一条最长的路径一定是红黑交错的,那么最短路径一定是纯黑色的节点;而又第5条从任一节点到其叶子节点的所有路径上都包含相同数目的黑节点,这么来说最长路径上的黑节点的数目和最短路径上的黑节点的数目相等!而又第2条根结点为黑、第3条叶子节点是黑,因此在一条由黑色节点开始和结尾的路径中,穿插在黑色节点之间的红色节点永远不可能多于黑色节点,那么可知:最长路径<=2*最短路径。一颗二叉树的平衡性能越好,那么它的效率越高!显然红黑树的平衡性能比AVL的略差些,但是经过大量试验证明,实际上红黑树的效率还是很不错了,仍能达到O(logN)。
因为每一个红黑树也是一个特化的二叉查找树,因此红黑树上的只读操作与普通二叉查找树上的只读操作相同。然而,在红黑树上进行插入操作和删除操作会导致不再符合红黑树的性质。恢复红黑树的属性需要少量(O(log n))的颜色变更(实际是非常快速的)和不超过三次树旋转(对于插入操作是两次)。虽然插入和删除很复杂,但操作时间仍可以保持为O(log n) 次。
插入操作
由于性质的约束:插入点不能为黑节点,应插入红节点。因为你插入黑节点将破坏性质5,所以每次插入的点都是红结点,但是若他的父节点也为红,那岂不是破坏了性质4?对啊,所以要做一些“旋转”和一些节点的变色!另为叙述方便我们给要插入的节点标为N(红色),父节点为P,祖父节点为G,叔节点为U。下边将一一列出所有插入时遇到的情况:
情形1:该树为空树,直接插入根结点的位置,违反性质1,把节点颜色有红改为黑即可。
情形2:插入节点N的父节点P为黑色,不违反任何性质,无需做任何修改。
情形1很简单,情形2中P为黑色,一切安然无事,但P为红就不一样了,下边是P为红的各种情况,也是真正要学的地方!
情形3:N为红,P为红,(祖节点一定存在,且为黑,下边同理)U也为红,这里不论P是G的左孩子,还是右孩子;不论N是P的左孩子,还是右孩子。
操作:如图把P、U改为黑色,G改为红色,未结束。
解析:N、P都为红,违反性质4;若把P改为黑,符合性质4,显然左边少了一个黑节点,违反性质5;所以我们把G,U都改为相反色,这样一来通过G的路径的黑节点数目没变,即符合4、5,但是G变红了,若G的父节点又是红的不就有违反了4,是这样,所以经过上边操作后未结束,需把G作为起始点,即把G看做一个插入的红节点继续向上检索----属于哪种情况,按那种情况操作~要么中间就结束,要么知道根结点(此时根结点变红,一根结点向上检索,那木有了,那就把他变为黑色吧)。
情形4:N为红,P为红,U为黑,P为G的左孩子,N为P的左孩子(或者P为G的右孩子,N为P的左孩子;反正就是同向的)。
操作:如图P、G变色,P、G变换即左左单旋(或者右右单旋),结束。
解析:要知道经过P、G变换(旋转),变换后P的位置就是当年G的位置,所以红P变为黑,而黑G变为红都是为了不违反性质5,而维持到达叶节点所包含的黑节点的数目不变!还可以理解为:也就是相当于(只是相当于,并不是实事,只是为了更好理解;)把红N头上的红节点移到对面黑U的头上;这样即符合了性质4也不违反性质5,这样就结束了。
情形5:N为红,P为红,U为黑,P为G的左孩子,N为P的右孩子(或者P为G的右孩子,N为P的左孩子;反正两方向相反)。
操作:需要进行两次变换(旋转),图中只显示了一次变换-----首先P、N变换,颜色不变;然后就变成了情形4的情况,按照情况4操作,即结束。
解析:由于P、N都为红,经变换,不违反性质5;然后就变成4的情形,此时G与G现在的左孩子变色,并变换,结束。
删除操作
我们知道删除需先找到“替代点”来替代删除点而被删除,也就是删除的是替代点,而替代点N的至少有一个子节点为NULL,那么,若N为红色,则两个子节点一定都为NULL(必须地),那么直接把N删了,不违反任何性质,ok,结束了;若N为黑色,另一个节点M不为NULL,则另一个节点M一定是红色的,且M的子节点都为NULL(按性质来的,不明白,自己分析一下)那么把N删掉,M占到N的位置,并改为黑色,不违反任何性质,ok,结束了;若N为黑色,另一个节点也为NULL,则把N删掉,该位置置为NULL,显然这个黑节点被删除了,破坏了性质5,那么要以N节点为起始点检索看看属于那种情况,并作相应的操作,另还需说明N为黑点(也许是NULL,也许不是,都一样),P为父节点,S为兄弟节点,分为以下5中情况:
情形1:S为红色(那么父节点P一定是黑,子节点一定是黑),N是P的左孩子(或者N是P的右孩子)。
操作:P、S变色,并交换----相当于AVL中的右右中旋转即以P为中心S向左旋(或者是AVL中的左左中的旋转),未结束。
解析:我们知道P的左边少了一个黑节点,这样操作相当于在N头上又加了一个红节点----不违反任何性质,但是到通过N的路径仍少了一个黑节点,需要再把对N进行一次检索,并作相应的操作才可以平衡(暂且不管往下看)。
情形2:P、S及S的孩子们都为黑。
操作:S改为红色,未结束。
解析:S变为红色后经过S节点的路径的黑节点数目也减少了1,那个从P出发到其叶子节点到所有路径所包含的黑节点数目(记为num)相等了。但是这个num比之前少了1,因为左右子树中的黑节点数目都减少了!一般地,P是他父节点G的一个孩子,那么由G到其叶子节点的黑节点数目就不相等了,所以说没有结束,需把P当做新的起始点开始向上检索。
情形3:P为红(S一定为黑),S的孩子们都为黑。
操作:P该为黑,S改为红,结束。
解析:这种情况最简单了,既然N这边少了一个黑节点,那么S这边就拿出了一个黑节点来共享一下,这样一来,S这边没少一个黑节点,而N这边便多了一个黑节点,这样就恢复了平衡,多么美好的事情哈!
情形4:P任意色,S为黑,N是P的左孩子,S的右孩子SR为红,S的左孩子任意(或者是N是P的右孩子,S的左孩子为红,S的右孩子任意)。
操作:SR(SL)改为黑,P改为黑,S改为P的颜色,P、S变换--这里相对应于AVL中的右右中的旋转(或者是AVL中的左左旋转),结束。
解析:P、S旋转有变色,等于给N这边加了一个黑节点,P位置(是位置而不是P)的颜色不变,S这边少了一个黑节点;SR有红变黑,S这边又增加了一个黑节点;这样一来又恢复了平衡,结束。
情形5:P任意色,S为黑,N是P的左孩子,S的左孩子SL为红,S的右孩子SR为黑(或者N是P的有孩子,S的右孩子为红,S的左孩子为黑)。
操作:SL(或SR)改为黑,S改为红,SL(SR)、S变换;此时就回到了情形4,SL(SR)变成了黑S,S变成了红SR(SL),做情形4的操作即可,这两次变换,其实就是对应AVL的右左的两次旋转(或者是AVL的左右的两次旋转)。
解析:这种情况如果你按情形4的操作的话,由于SR本来就是黑色,你无法弥补由于P、S的变换(旋转)给S这边造成的损失!所以我没先对S、SL进行变换之后就变为情形4的情况了,何乐而不为呢?
好了,这五种情况都讨论完了,我想强调的是:注意哪些分方向的情况,每个分方向的情形就两种情况,不要搞迷了!下边我写的代码,不用关心是什么方向,我主要是用一个指针数组即child[2],0代表左,1代表右,进行两个节点的变换(旋转)的时候只需向conversion(&T,direction);传入父节点指针的地址及子节点在父节点的方位(0或1);有兴趣可以看代码.
简介:主要是用递归实现插入、删除,回溯时检索并恢复平衡:
1#include <stdio.h>
2 #include <stdlib.h>
3
4 #define RED 0
5 #define BACK 1
6
7 typedef int Elemtype;
8
9 //定义一个红黑树的结点
10 typedef struct Red_Back_Tree
11 {
12 Elemtype e;
13 int color;
14 struct Red_Back_Tree * child[2];
15 }* RBT;
16
17 // 两个节点变换函数
18 void conversion(RBT *T,int direction);
19
20 // 删除一个节点的所用函数
21 int DeleteRBT(RBT *T,Elemtype e); // 删除主(接口)函数
22 int find_replace_point(RBT gogal,RBT *l); // 寻找替代点
23 int keep_balance_for_delete(RBT *T,int direction); // 删除的平衡操作
24 int do_with_start_point(RBT gogal,RBT *T,int direction); // 处理第一个起始点
25
26 // 插入一个节点的所用函数
27 int InsertRBT(RBT *T,Elemtype e); // 插入接口函数
28 int _InsertRBT(RBT *T,Elemtype e); // 插入主函数
29 int keep_balance_for_insert(RBT *T,int firdirection,Elemtype e);// 插入的平衡操作
30 RBT create_one_node(Elemtype e); // 新建一个节点
31
32
33
34 void conversion(RBT *T,int direction)
35 {
36 RBT f=(*T),s=f->child[direction],ss=s->child[!direction];
37
38 f->child[direction]=ss;
39 s->child[!direction]=f;
40 *T=s;
41 }
42
43 //★★★★★★★★★★★★★★★★★删除操作★★★★★★★★★★★★★★★★★★★★★★★★★★★
44
45 int do_with_start_point(RBT gogal,RBT *T,int direction)
46 {
47 gogal->e=(*T)->e;
48 if(BACK==((*T)->color))
49 {
50 if(NULL!=(*T)->child[direction])
51 {
52 (*T)->e=(*T)->child[direction]->e;
53 free((*T)->child[direction]);
54 (*T)->child[direction]=NULL;
55 return 1;
56 }
57 else
58 {
59 free((*T));
60 *T=NULL;
61 return 0;
62 }
63 }
64 else
65 {
66 free((*T));
67 (*T)=NULL;
68 return 1;
69 }
70 }
71
72 int keep_balance_for_delete(RBT *T,int direction)
73 {
74 RBT p=(*T),b=p->child[!direction];
75
76 if(RED==b->color)
77 {
78 p->color=RED;
79 b->color=BACK;
80 // conversion(&p,!direction);//很恐怖的一个写法,偶然中发现:这里传的地址是假的!不是T!!
81 // 考我怎么这么傻逼!!如果不是及时发现,到调试时将是无限恐怖
82 // 将是一个巨大的隐藏的BUG!!!将会带来巨大的麻烦!!!
83 conversion(T,!direction);
84 return keep_balance_for_delete(&((*T)->child[direction]),direction);
85 }
86 else if(BACK==p->color && BACK==b->color &&
87 (NULL==b->child[0] || BACK==b->child[0]->color) &&
88 (NULL==b->child[1] || BACK==b->child[1]->color)) //这里感觉不美,就一次为NULL却每次要
89 { //判断是否为NULL,不美……
90 b->color=RED;
91 return 0;
92 }
93 else if(RED==p->color &&
94 (NULL==b->child[0] || BACK==b->child[0]->color) &&
95 (NULL==b->child[1] || BACK==b->child[1]->color))
96 {
97 p->color=BACK;
98 b->color=RED;
99 return 1;
100 }
101 // 第一次调试
102 // 调试原因:由于删除0点未按预料的操作应该是情况④,却按⑤操作
103 // 错误的地方:RED==b->child[!direction] ! 丢了->color 这个错误我上边错了几次,不过编译器报错改了过来
104 // 这次的编译器不报错,看代码也看不错来,最后追究到这里,一一对照才发现!!!
105 // else if(BACK==b->color && (NULL!=b->child[!direction] && RED==b->child[!direction]))
106 else if(BACK==b->color && (NULL!=b->child[!direction] && RED==b->child[!direction]->color))
107 {
108 b->color=p->color;
109 p->color=BACK;
110 b->child[!direction]->color=BACK;
111 conversion(T,!direction);
112 return 1;
113 }
114 else
115 {
116 b->child[direction]->color=p->color;
117 p->color=BACK;
118 conversion(&(p->child[!direction]),direction);//这里的p写的才算不错!即p也(*T)都行,一样!
119 conversion(T,!direction);
120 return 1;
121 }
122
123 }
124
125 int find_replace_point(RBT gogal,RBT *l)
126 {
127 if(NULL!=(*l)->child[0])
128 {
129 if(find_replace_point(gogal,&(*l)->child[0])) return 1;
130 return keep_balance_for_delete(l,0);
131 //...
132 }
133 // 第二次调试---其实没F5,F10,F11,根据结果猜测,到这里看看还真是的!
134 // 调试原因:删除0好了,删除1又错了---2不见了,1还在
135 // 错误的地方:就在这里,找到替代点,却没有“替代”,这等于把替代点删了...
136 // 这里很明显,gogal这个删除点指针根本就没用...我当时忘了吧!!修改如下!
137 // else //替代点为起始点
138 // {
139 // return do_with_start_point(l,1);
140 // }
141 else
142 {
143 return do_with_start_point(gogal,l,1);
144 }
145 }
146
147 int DeleteRBT(RBT *T,Elemtype e)
148 {
149 if(!(*T)) return -1;
150 else if(e>(*T)->e)
151 {
152 if(DeleteRBT(&((*T)->child[1]),e)) return 1;
153 return keep_balance_for_delete(T,1);
154 //...
155 }
156 else if(e<(*T)->e)
157 {
158 if(DeleteRBT(&((*T)->child[0]),e)) return 1;
159 return keep_balance_for_delete(T,0);
160 //...
161 }
162 else
163 {
164 if(NULL!=(*T)->child[1]) //真正的删除点不是起始点,需找替代点
165 {
166 if(find_replace_point((*T),&((*T)->child[1]))) return 1;
167 return keep_balance_for_delete(T,1);
168 //...
169 }
170 else //真正的删除点就是起始点
171 {
172 return do_with_start_point((*T),T,0);
173 }
174 }
175 }
176 //★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
177
178
179 //★★★★★★★★★★★★★★★★★★★插入操作★★★★★★★★★★★★★★★★★★★★★★★★★
180
181 RBT create_one_node(Elemtype e)
182 {
183 RBT p=(RBT)malloc(sizeof(struct Red_Back_Tree));
184 p->e=e; p->color=RED;
185 p->child[0]=p->child[1]=NULL;
186 return p;
187 }
188
189 int keep_balance_for_insert(RBT *T,int firdirection,Elemtype e)
190 {
191 RBT p=(*T)->child[firdirection],u=(*T)->child[!firdirection];
192 int secdirection=( (e>p->e) ? 1 : 0 ); // 查处第二个方向
193
194 if(NULL!=u && RED==u->color) /*****③叔节点为红色*****/
195 {
196 p->color=BACK;
197 u->color=BACK;
198 (*T)->color=RED;
199 return 1; //继续...
200 }
201 else /*****④叔节点为黑色*****/
202 {
203 if(firdirection!=secdirection) conversion(&((*T)->child[firdirection]),secdirection);
204 (*T)->color=RED; (*T)->child[firdirection]->color=BACK;
205 conversion(T,firdirection);
206 return 0;
207 }
208 }
209
210 int _InsertRBT(RBT *T,Elemtype e)
211 {
212 int info=0;
213 if(NULL==(*T)) /*****①插入到根节点*****/ //这里只是包含这种情况
214 {
215 *T=create_one_node(e);
216 (*T)->color=RED;
217 info=1;
218 }
219 else if(e>((*T)->e))
220 {
221 info=_InsertRBT(&(*T)->child[1],e);
222 if(info<1) return info;
223 else if(info==1) /*****②父节点为黑******/
224 {
225 if(BACK==((*T)->color)) info--;
226 else info++;
227 }
228 else
229 {
230 info=keep_balance_for_insert(T,1,e);
231 }
232
233 }
234 else if(e<((*T)->e))
235 {
236 info=_InsertRBT(&((*T)->child[0]),e);
237 if(info<1) return info;
238 else if(info==1)
239 {
240 if(BACK==((*T)->color)) info--;
241 else info++;
242 }
243 else
244 {
245 info=keep_balance_for_insert(T,0,e);
246 }
247
248 }
249 else return info=-1;
250
251 return info;
252 }
253
254 int InsertRBT(RBT *T,Elemtype e) //插入节点函数返回值: -1->改点已存在 0->成功插入
255 {
256 int info=0; // info: -1->已存在 0->结束 1->回溯到父节点 2->回溯到祖节点
257
258 //2011年11月30日9:13:47 昨天晚上最后又想来这里这个if可以不要即可,也就是把它也放到_InsertRBT
259 //内处理,在InsertRBT中有个判断即可!即改成下边的写法!
260 // if(NULL==(*T)) /*****①插入到根节点*****/
261 // {
262 // *T=create_one_node(e);
263 // (*T)->color=BACK;
264 // }
265 // else
266 // {
267 // info=_InsertRBT(T,e); // 经过再三思考,这里info的返回值只可能为:-1 0 1
268 // if(info>0) (*T)->color=BACK,info=0; // 查看根节点是否为红
269 // }
270
271 info=_InsertRBT(T,e);
272 if(info==1) (*T)->color=BACK,info=0;
273 // 为了防止根结点变为红,它其实是处理了两种情况的后遗症
274 // 分别是:③情况回溯上来,根节点变红 ①情况插入点即为根节点,为红
275 // 这里没有直接把根结点变黑,主要是为了与_InsertRBT保持一致的写法,其实都行!
276 return info;
277 }
278 //★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
279
280
281 //******************JUST FOR TEST********************//
282 RBT queue[1000];
283 void print(RBT cur)
284 {
285 int front=0,rear=0;
286 int count=1,temp=0;
287
288 if(NULL==cur)
289 {
290 printf("NULL\n");
291 return ;
292 }
293
294 queue[rear]=cur;
295 while(front<=rear)
296 {
297 cur=queue[front++]; count--;
298 if(NULL!=cur->child[0]) queue[++rear]=cur->child[0],temp++;
299 if(NULL!=cur->child[1]) queue[++rear]=cur->child[1],temp++;
300
301 printf("%d color->",cur->e);
302 if(BACK==cur->color) printf("BACK |");
303 else printf("RED |");
304
305 if(0==count)
306 {
307 count=temp;
308 temp=0;
309 printf("\n");
310 }
311 }
312 }
313 //*****************************************************//
314
315 //*****************DEAR MAIN***************************//
316 int main()
317 {
318 RBT T=NULL;
319 int i,nodenum=100;
320
321 print(T);
322 printf("\n");
323
324 printf("\n插入操作\n");
325 for(i=0;i<nodenum;i++)
326 {
327 InsertRBT(&T,i);
328 printf("插入%d\n",i);
329 print(T);
330 printf("\n");
331 }
332
333 // print(T);
334 printf("\n删除操作:\n");
335
336 for(i=0;i<nodenum;i++)
337 {
338 DeleteRBT(&T,i);
339 printf("删除%d\n",i);
340 print(T);
341 printf("\n");
342 }
343
344 return 0;
345 }
转自:http://www.cnblogs.com/fornever/archive/2011/12/02/2270692.html
参考:http://zh.wikipedia.org/wiki/%E7%BA%A2%E9%BB%91%E6%A0%91