最小生成树之Prim Kruskal算法(转)

最小生成树

首先,生成树是建立在无向图中的,对于有向图,则没有生成树的概念,所以接下来讨论的图均默认为无向图。对于一个有n个点的图,最少需要n-1条边使得这n个点联通,由这n-1条边组成的子图则称为原图的生成树。一般来说,一个图的生成树并不是唯一的(除非原图本身就是一棵树)。
现在考虑带权图G,即图的边带权,则最小生成树就是在G中权值和最小的一颗生成树,显然最小生成树也不是唯一的,但是其权值唯一。有很多应用需要用到最小生成树的概念,比较直观的一个应用就是:有n个村庄,现在要在这些村庄之间修一些路,其中村庄i和村庄j之间的距离是Dij,现在要修最短的路使得所有村庄连接起来。
显然,这个问题可以直接套用最小生成树模型,找出最小生成树即找到了一个方案。
下面举一个最小生成树的例子:
 

 
对于如何寻找一个带权图的最小生成树,已经有了专门的求解方法,在具体讲解这些算法之前,我们这里先来挖掘一下最小生成树的一些特性,即一颗生成树要成为最小生成树,需要满足什么条件。
 
MST性质:
设一个带权无向图G(V,E,W) (V代表点集,E代表边集,W代表权值集),且T为G的一颗生成树,对于E中任意一条不属于T的边e,将其加入T中,会产生一条环(否则T不连通),如果e始终是环中权值最大的一条边,那么说明T满足MST性质。
 
以上是MST性质的定义,其中MST就是最小生成树的意思,但是现在并没有证明这个性质和最小生成树有什么关系,接下来将要证明,一颗生成树是最小生成树,当且仅当它满足MST性质。
 
引理1:对于图G(V,E,W)的两颗生成树T1和T2,若它们都满足MST性质,则它们的权值和相同。
 
证明:运用数学归纳法证明当有k条边在T1中而不在T2中时(0<=k<=n-1,同样的,这是也有k条边在T2中而不在T1中),T1的权值和等于T2的权值和。
 
1:首先,当k=0时,说明T1和T2的所有边都一样,则T1和T2是同一颗生成树,显然它们的权值和相等。
2:现在设当k<x时,T1和T2的权值和相等,现在要证明当k=x时,T1,T2权值和依然相等。考虑这样的边集S,它们在T1或T2中,但是不同时存在于T1和T2。在S中,取权值最小的那条边,设为e(u,v),不妨认为它在T1中(在T2中同理)。e连接了图中u,v两点。考虑T2中u到v之间的路径,设为E1,E2......Em(m>1),其中一定存在若干条边不在T1中(否则T1中存在环),设e'为这些边中的一条。
(1)e’和e都属于S,所以e'的权值不小于e。
(2)由于T2满足MST性质,且e不属于T2,那么可知e'的权值不大于e。
综上所述,e的权值和e'的权值相等,所以,将T2的边e'去掉,换成e,变成T2',显然,T2'和T2的权值和相等,又T2'与T1只有x-1条边不同(即有x-1条边在T1中而不在T2中)。由归纳法可知T2'和T1的权值和相等,所以T2和T1的权值和相等。
证毕。
 

 
有了引理1,那么MST性质和最小生成树的关系就很容易证明了。
定理1:一颗生成树T是最小生成树,当且仅当它满足MST性质。
 
证明:
1:最小生成树->满足MST性质
 
设T是G(V,E,W)的最小生成树,采用反证法,如果T不满足MST性质,那么说明存在一条边e,其不存在与T中,将其加入T中后,它不是环中权值最大的边,设环中比e还大的边为e',那么我们将T中的e'去掉,换成e,得到的生成树T'将会拥有更小的权值和,这和T是最小生成树矛盾,所以,如果T是最小生成树,则T一定满足MST性质。
 
2:满足MST性质->最小生成树
 
设T是G(V,E,W)的生成树,其满足MST性质。由1我们知道,G的最小生成树满足MST性质,再由引理1,我们知道,两颗满足MST性质的生成树权值和相等,所以T的权值和与最小生成树相等,所以T是G的一颗最小生成树。
证毕。
 
以上证明了最小生成树的一个关键性质,下面是时候讲解求解最小生成树的具体算法了。求解最小生成树有两个经典算法。Prim算法和Kruskal算法。下面分别介绍这两个算法的步骤和正确性证明。
 

Prim算法:

Prim算法基于一种贪心的思想,通过局部最优策略,每次将一条边加入所构建的生成树中,加完n-1条边后,保证最后所得的生成树是整体最优的,即最小生成树。下面简单说明下Prim算法的步骤:
 
Prim算法将图中的每个点分成三种状态:
第一种tree点,表示该点已经在所构造的生成树中。
第二种fringe点,表示还没在树中,但是和Tree点相邻(有一条边直接相连),是即将要加入生成树中的候选点。
第三种unseen点,其他的点,表示还没有检测到的点。
 
那么Prim算法步骤为:
 
1:初始时将所有点初始化成unseen,并且随机将一个点S设为tree点(如1号点)。
2:将所有与S相邻的点设为fringe。
3:如果图中还存在fringe点,则到4,否则到6。
4:在所有连接一个fringe点和一个tree点的边中,取权值最小的边e(u,v),不妨设u为tree点,v为fringe点,将v点设为tree点。
5:将所有与v相邻的unseen点设为fringe,并将e加入到构建的生成树中。转到3。
6 :  如果图中所有点均为tree点,则图的一个最小生成树找到。否则原图不存在最小生成树。
7:算法结束。
 
根据所给算法描述,很容易得到算法的代码实现,算法实现需要用到堆优化,不熟悉堆的朋友可以自行上网查询,这里不再赘述:
 
  1. //Prim  
  2. struct edge{  
  3.     int to,len,next;  
  4. }e[maxm];  
  5. int box[maxn],cnt,used[maxn];  
  6. void init(int n){  
  7.     for(int i=0;i<=n;i++)box[i]=-1;  
  8.     cnt=0;  
  9. }  
  10. void add(int from,int to,int len){  
  11.     e[cnt].to=to;  
  12.     e[cnt].len=len;  
  13.     e[cnt].next=box[from];  
  14.     box[from]=cnt++;  
  15. }  
  16. struct node{  
  17.     int v,len;  
  18.     node(){}  
  19.     node(int x,int y):v(x),len(y){}  
  20.     bool operator<(const node &x)const{  
  21.         return len>x.len;  
  22.     }  
  23. };  
  24. priority_queue<node> pq;  
  25. int Prim(int n,int m){  
  26.     memset(used,0,sizeof(used));//初始化所有点,设状态为unseen  
  27.     int num=0,sum=0,now=1;  
  28.     do{  
  29.         used[now]=1;  
  30.         for(int t=box[now];t+1;t=e[t].next){  
  31.             int v=e[t].to,len=e[t].len;  
  32.             if(!used[v])pq.push(node(v,len));  
  33.         }  
  34.         while(!pq.empty()){  
  35.             node tmp=pq.top();pq.pop();  
  36.             int v=tmp.v,len=tmp.len;  
  37.             if(used[v])continue;  
  38.             now=v;  
  39.             sum+=len;  
  40.             break;  
  41.         }  
  42.         num++;  
  43.     }while(num<n);  
  44.     return sum;  
  45. }  
//Prim
struct edge{
    int to,len,next;
}e[maxm];
int box[maxn],cnt,used[maxn];
void init(int n){
    for(int i=0;i<=n;i++)box[i]=-1;
    cnt=0;
}
void add(int from,int to,int len){
    e[cnt].to=to;
    e[cnt].len=len;
    e[cnt].next=box[from];
    box[from]=cnt++;
}
struct node{
    int v,len;
    node(){}
    node(int x,int y):v(x),len(y){}
    bool operator<(const node &x)const{
        return len>x.len;
    }
};
priority_queue<node> pq;
int Prim(int n,int m){
    memset(used,0,sizeof(used));//初始化所有点,设状态为unseen
    int num=0,sum=0,now=1;
    do{
        used[now]=1;
        for(int t=box[now];t+1;t=e[t].next){
            int v=e[t].to,len=e[t].len;
            if(!used[v])pq.push(node(v,len));
        }
        while(!pq.empty()){
            node tmp=pq.top();pq.pop();
            int v=tmp.v,len=tmp.len;
            if(used[v])continue;
            now=v;
            sum+=len;
            break;
        }
        num++;
    }while(num<n);
    return sum;
}

现在来看看为什么Prim算法是正确的。
首先,如果一个图存在最小生成树,那么由上面的算法得到的一定是一颗生成树。因为当算法结束时,所有的点均为tree点,说明所有点都连通。并且得到的子图不会存在环,因为我们增加一条边时,这条边连接的一定是一个tree点和一个finge点,只有连接两个tree点时才会产生环。
前面的定理1告诉我们,一颗生成树是最小生成树,那么当且仅当它满足MST性质,那么我们只要证明Prim算法得到的生成树满足MST性质即可。
 
定理2:设带全图G(V,E,W)存在最小生成树,那么Prim算法得到的生成树就是G的最小生成树。
 
证明:我们只要证明,Prim算法得到的生成树满足MST性质即可,这可由归纳法证明。下面证明,当加入第k个点时(1<=k<=n),Prim算法得到生成树满足MST性质:
 
1:当k=1时,只有一个点,显然满足MST性质。
2:当k>1时,我们假设当1k<x时,均满足,当k=x时,假设当前所加入的边为e(u,v),同样地,设u为tree点,v为fringe点,未加入x前的生成树为T。我们假设T+e=T'得到的生成树不满足MST性质。既然不满足MST性质,那么一定存在一条边e'(x,y),加入T'后,产生的环中存在权值大于e'的边。
如果x,y都不等于v,那么加入e'产生的环存在于T中,但是T满足MST性质(因为T中只有x-1个点),所以x,y中一定有一个是v。不妨设y=v。
那么如下图:
 

 
如上图,设u到x之间的路径为W1......Wa,Wa+1.....Wb-1,Wb.......Wp,其中W1为u,Wp为x,设边WaWa+1是路径中第一条权值大于e'的边,
Wb-1Wb是最后一条权值大于e'的边(有可能这两条边是同一条)。不妨设WaWa+1先于Wb-1Wb加入到T中,那么由Prim算法的步骤,知W1W2,W2W3.......Wa-1Wa均会先于WaWa+1加入到T'中,进一步由于e先于e’加入到T中,所以有|e|<=|e'|<|Wb-1Wb|,所以e和e'均会先于WaWa+1加入到T'中,但是事实是,e'并不在T'中,而且它比WaWa+1要晚加入T'中,所以矛盾。所以T'加入e'后,所产生的环中e'的权值最大,满足MST性质。那么当k=n的时候,也就是算法完成的时候,所得到的生成树就是整个图G的生成树,它满足MST性质,由定理1可知,它是最小生成树。证毕。

Kruskal算法:

Kruskal算法同样是基于贪心策略,但是它和Prim算法不同的是,在算法过程中它并不维护一个连通的分量,而是将多个连通分量合并到一起得到一颗生成树。个人觉得Kruskal算法的思想比它算法本身要重要,能够解决很多其他问题,至少是在ACM比赛中吧。
 
下面描述一下Kruskal算法的步骤:
首先将图中的所有的边按照其权值从小到大排序,然后从小到大枚举边。设需要构造的生成树为T。
1:初始时,T中没有变,所有点看成是一个单独的集合。
2:如果枚举完最后一条边,则到4,否则到3。
3:设当前枚举的边为e(u,v),如果u,v不在同一个集合中,则将e加入到T中,并且将u和v合并到一个集合中,否则,忽略e。转到2.
4:如果T中含有n-1条边,则说明找到原图的最小生成树,否则说明原图没有最小生成树。算法结束。
 
算法的实现需要一些额外的知识,首先是要从小到大枚举边,这里可以用快速排序直接将边集排序,或者可以用小顶堆来初始化边集。
然后是要判断两个点是否在统一集合中,还需要将两个集合合并到一个集合中。这里要用到并查集这一数据结构。这方面的知识请自行参考相关资料。
下面是利用快速排序和并查集实现的Kruskal算法。
  1. #define maxn 110  
  2. #define maxm 10010  
  3. using namespace std;  
  4. int uf[maxn];  
  5. struct edge{  
  6.     int u,v,len;  
  7. }e[maxm];  
  8. bool cmp(const edge &x,const edge &y){  
  9.     return x.len<y.len;  
  10. }  
  11. void init(int n){//初始化并查集  
  12.     for(int i=0;i<=n;i++)uf[i]=i;  
  13. }  
  14. int find(int x){  
  15.     if(x==uf[x])return x;  
  16.     return uf[x]=find(uf[x]);  
  17. }  
  18. int Union(int x,int y){//合并两个集合(如果x,y在同一集合,返回0,否则返回1)  
  19.     x=find(x),y=find(y);  
  20.     if(x!=y){  
  21.         uf[x]=y;  
  22.         return 1;  
  23.     }  
  24.     return 0;  
  25. }  
  26. int Kruskal(int n,int m){//n个点,m条边  
  27.     sort(e,e+m,cmp);//排序  
  28.     int sum=0;//最小生成树的权值和  
  29.     for(int i=0;i<m;i++){//从小到大枚举边  
  30.         int u=e[i].u,v=e[i].v,len=e[i].len;  
  31.         sum+=len*Union(u,v);  
  32.     }  
  33.     return sum;//返回权值和  
  34. }  
#define maxn 110
#define maxm 10010
using namespace std;
int uf[maxn];
struct edge{
    int u,v,len;
}e[maxm];
bool cmp(const edge &x,const edge &y){
    return x.len<y.len;
}
void init(int n){//初始化并查集
    for(int i=0;i<=n;i++)uf[i]=i;
}
int find(int x){
    if(x==uf[x])return x;
    return uf[x]=find(uf[x]);
}
int Union(int x,int y){//合并两个集合(如果x,y在同一集合,返回0,否则返回1)
    x=find(x),y=find(y);
    if(x!=y){
        uf[x]=y;
        return 1;
    }
    return 0;
}
int Kruskal(int n,int m){//n个点,m条边
    sort(e,e+m,cmp);//排序
    int sum=0;//最小生成树的权值和
    for(int i=0;i<m;i++){//从小到大枚举边
        int u=e[i].u,v=e[i].v,len=e[i].len;
        sum+=len*Union(u,v);
    }
    return sum;//返回权值和
}
 
Kruskal算法的正确性
 
同Prim算法正确性证明一样,我们只要证明Kruskal算法得到的生成树满足MST性质即可。首先,如果G存在最小生成树,那么Kruskal算法得到肯定是一颗生成树。这点就不证明了,用反证法可以很容易证明。
 
定理3:设带全图G(V,E,W)存在最小生成树,那么Kruskal算法得到的生成树就是G的最小生成树。
 
证明:设Kruskal算法结束时得到的生成树为T,假设T不满足MST性质,那么存在一条边e(u,v),它不属于T,将e加入T中后,得到一个环。设环中存在一条(可能是多条)边e',其权值大于e。那么由Kruskal算法的步骤,可知,e在e'之前枚举。当枚举e'之前,可知u,v一定不在同一个集合中,否则e'就不会在T中了。那么既然在e'加入之前,u,v不在同一个集合中,那么枚举e时(e在e'加入前被枚举),根据Kruskal算法的步骤3,可知e一定在T中,但是e并不在T中,矛盾,所以加入e后,所得到的环中e的权值最大。这就表示T满足MST性质。从而由定理1,可知T是G的一颗最小生成树。证毕。
 
总结:到此为止,最小生成树的总结就写完了,介绍的两个算法都是基于贪心思想的应用。个人觉得学习算法一定不能仅仅记住算法的代码实现,一定还要理解其中的思想和正确性。只有这样才能真正了解一个算法的精髓。就算是忘了代码的实现,理解了思想也能自己推出来。这应该才是学习的不二法门吧。
posted @ 2018-06-13 09:00  木&子  阅读(416)  评论(0编辑  收藏  举报