数据结构与算法分析(四)——不相交集

  • 基本介绍

一个集合S,集合中一个元素a。a的等价类是S的一个子集,该子集包含所有与a有关系的元素。

等价类形成是对S的一个划分且S中的每一个成员恰好出现在一个等价类中。这样,判断a与b是否有关系,

只需要判断a与b是否在一个等价类中即可。

 

对于集合S划分,取任意两个等价类,Si与Sj,如果Si∩Sj = ∅,则称这些集合不相交。

对于不相交集,有两种操作,Union/Find操作。Find操作找包含给定元素的集合(等价类)名字。

Union把两个等价类合并成一个新的等价类。

 

  • 数据结构:采用树来表示每一个集合(等价类),因为树上的元素都有一个共同的根。

Union(X, Y),将X,Y合并成一个新的等价类,且X做为根。

Union(5,6)

Union(7,8)

Union(5,7)

这样的构造方法,最坏情况下可以构建一课高度为N-1的树,即Union(7,8), Union(6,7), Union(5,6)……

这使得Find操作在N-1次操作下才能找到树根,运行时间O(N)

将上述森林用数组表示,约定数组1-8个元素对应的值代表其父亲,例如元素8对应的值为7,表示其父亲为7。

而5对应的值为0,表示5本身就是树根。

这样找树根就是一个递归过程,如:Find(8), 父亲为7, 执行Find(7),父亲为5,执行Find(5),对应值为0,表示5为树根,递归结束,

这样即找到8所在等价类的树根为5。判断6,8是否有关系,即Find(8) == Find(6)是否成立。 

 1 typedef int SetType;  
 2 typedef int ElementType;  
 3 typedef int* DisjSet;  
 4   
 5 DisjSet Initialize(int Num)  
 6 {  
 7     DisjSet S = new SetType[Num + 1];  
 8   
 9     for(int i = 0; i < Num + 1; i++)  
10         S[i] = 0;  
11     return S;  
12 }  
13   
14 void Destroy(DisjSet S)  
15 {  
16     delete [] S;  
17 }  
18   
19 void Union(DisjSet S, SetType root1, SetType root2)  
20 {  
21     S[root2] = root1;  
22 }  
23   
24 SetType Find(DisjSet S, ElementType X)  
25 {  
26     if(S[X] <= 0)  
27         return X;  
28     else  
29         return Find(S, S[X]);  
30 }  
31   
32 int main()  
33 {  
34     int elementNum = 8;  
35     DisjSet S = Initialize(elementNum);  
36   
37     Union(S, 5, 6);  
38     Union(S, 7, 8);  
39     Union(S, 5, 7);  
40   
41     cout << ( Find(S, 4) == Find(S, 5) )<< endl;  
42     cout << ( Find(S, 6) == Find(S, 8) )<< endl;  
43   
44     Destroy(S);  
45     system("pause");  
46     return 0;  
47 }  
View Code

  

  • 优化Union

为了避免树的深度过大,可以每次让深度大的树做为新根,这样减少树深度增加速率。

那么就需要记住当前根的深度,而由于我们只采用了一个数组,所以,可以让根的值为负值,代表深度。

这样,根节点的值为-1,表示深度为-1。 

对于上述情形,执行Union(4,5)。按照之前的Union操作,得到结果为:

优化后结果

对应优化后结果的数组如下:

 1 void Union(DisjSet S, SetType root1, SetType root2)  
 2 {  
 3     if(S[root2] < S[root1])  
 4         S[root1] = root2;  
 5     else  
 6     {  
 7         if(S[root1] == S[root2])  
 8             S[root1]--;  
 9         S[root2] = root1;  
10     }  
11 }  
View Code

 

  • 路径压缩

对于比较深的树,Find操作还是比较耗时的,要一步一步递归直至树根。

改进思路:执行一次Find后,让该路径上,所有节点直接指向根,而不需要指向父亲,这样下一次查找的时候能够快速找到根,节约时间。

 

执行一次Find(8)操作。由于元素8所在树的树根为5,所以执行Find后,数组要变成。

这样,当进行下一次调用Find(8)的时候,能够快速找到8对应的树根。

1 SetType Find(DisjSet S, ElementType X)  
2 {  
3     if(S[X] <= 0)  
4         return X;  
5     else  
6         return S[X] = Find(S, S[X]);  
7 }  
View Code

 

 

posted @ 2014-11-03 22:06  oudan  阅读(301)  评论(0编辑  收藏  举报