并查集,是一个可以实现并集和查询操作的集合,其内部是用一颗树来维护的。
一个例子加深理解:通畅工程(HDOJ)
算法
用集合中的某个元素来代表这个集合,该元素称为集合的代表元。
一个集合内的所有元素组织成以代表元为根的树形结构。
对于每一个元素 f[x]指向x在树形结构上的父亲节点。如果x是根节点,则令f[x] = x。
对于查找操作,假设需要确定x所在的的集合,也就是确定集合的代表元。可以沿着f[x]不断在树形结构中向上移动,直到到达根节点。
判断两个元素是否属于同一集合,只需要看他们的代表元是否相同即可。
步骤
1.建立并查集:并查集是一棵树,这棵树用一个f[]数组来建立,f[i]代表i结点的父亲。在实行“并”操作之前,所有元素都是孤立的,f[i]←i;
for(i=1;i<=N;i++) f[i]=i;
2.根节点查询:引入一个代表元的概念,当我们想要知道一个元素在哪一棵树上时,我们可以用这棵树的根作为代表元,我们就说一个元素在以A根节点的树上,即这个元素所在集合的代表元是A,通过代表元来区分集合。欲查询一棵树所在的集合,即是查询这棵树的根节点,这就是为什么用f数组,顺着一个结点的f数组一路找上去,直到f[x]=x,就找到了。
int find(int x) { if(f[x]==x) return x; else return f[x]=find(f[x]); }
路径压缩
明显地,一次find操作需要从这个结点一直查到根节点,时间复杂度是树的深度。我们只关心一个结点所在树的根节点,不妨在查询的过程中,把所经过的每一个结点的父亲都设为根节点,那么下次在查询时,时间复杂度就变为O(1)。最终的find函数:
int find(int x) { if(f[x]==x) return x; else return f[x]=find(f[x]); }
3.并集:欲将个集合进行并集操作,即是将两个两棵树合成一棵树,只需让一个根节点成为另一个根节点的儿子。通常是要求将两个元素所在的集合取并集。用a、b表示两个不同集合中的元素,并集操作如下:
f[find(A)]=find(B);
/* 或者
fa=find(a),fb=find(b);
其他一些操作;
f[fa]=fb;
*/