图论--最小生成树总结(Prim&&Kruskal)

今天才写了prim的堆优化,发现kruskal居然比prim跑得快。。。


回归正题:
以下是我个人对最小生成树各种算法的理解,以及我的代码。
以下我将点数称为n,边数称为m;


Prim
算法过程(来自百度百科):
1. 输入:一个加权连通图,其中顶点集合为V,边集合为E;
2. 初始化:Vnew = {x},其中x为集合V中的任一节点(起始点),Enew = {},为空;
3. 重复下列操作,直到Vnew = V:
- a.在集合E中选取权值最小的边< u, v >,其中u为集合Vnew中的元素,而v不在Vnew集合当中,并且v∈V(如果存在有多条满足前述条件即具有相同权值的边,则可任意选取其中之一);
- b.将v加入集合Vnew中,将< u, v >边加入集合Enew中;
4. 输出:使用集合Vnew和Enew来描述所得到的最小生成树。
然后以下是我自己的解释:
初始时任选一个起点,并加入点集;
不断将离访问过的点集最近的未访问的点连边(或者说选最短的边),加入点集中,并将连边加入边集(或累加答案);
这样进行n-1次,每次加入一个点和一条边,结束后就会形成一棵n个节点,n-1条边的树;
正确性我也懒得证了,自己百度看吧。
时间复杂度:O(nm)
代码就不用看了,这个复杂度完全无法接受,必须优化;


Prim–堆优化
对于上面的过程,最有优化余地的一步是什么呢?

不断将离访问过的点集最近的未访问的点连边(或者说选最短的边

很明显,粗体字部分可以优化(一般来说,将求最小值或最大值从n优化至logn级别都是常见的优化);
具体方法就是将有可能扩展的边都放入一个小根堆中,每次取最小的,这样可以将每次取最小值的过程优化至log级别的;(不知道堆的同学可以自行百度)
时间复杂度:低于O(nlogm)
手写堆又会增加编程复杂度,我们可以使用c++自带的优先队列(priority_queue),这就是一个堆;

priority_queue< T > (T为类型)(后面括号内为时间复杂度)
1. T top(void):返回堆顶(即最值);(1)
2. void pop(void):弹出堆顶;(logn)
3. void push(T):压入新元素;(logn)
4. bool empty(void):如果堆为空返回true,否则返回false;(1)
5. int size(void):返回堆的元素数量;(1)
另一种定义方式:(建议)
priority_queue< T , vector< T > ,less< T > > (大根堆)
priority_queue< T , vector< T > ,greater< T > > (小根堆)
用自定义类型的前提是那个类型有定义小于号(大根堆)/ 大于号(小根堆)
关于比较符号定义可以看我的代码;


我的代码:

//此题来自洛谷P3366 【模板】最小生成树,是一道模板题,大家可以去做一下。
//我这里存边用的是邻接表,省空间,也方便;
//也可以用vector来存边
#include<bits/stdc++.h>
using namespace std;
struct edge{ //自定义边类
    int to,next,w;
    bool operator > (const edge& y) const { //大于号
        return w>y.w;
    }
}e[400001];
int n,m,tot;
int head[5001]; //邻接表用
int vis[5001]; //标记点是否访问过
priority_queue<edge,vector<edge>,greater<edge> > q; //小根堆
void addedge(int x,int y,int l){ //加边
    tot++;
    e[tot].to=y;
    e[tot].next=head[x];
    e[tot].w=l;
    head[x]=tot;
}
int prim(){ //我这里将1作为起点
    for(int i=head[1];i;i=e[i].next){ //将1的邻边都放入优先队列
        q.push(e[i]);
    }
    vis[1]=1;
    int ans=0;
    int left=n-1; //剩余需要加边数
    while(left&&!q.empty()){
        edge t=q.top();
        q.pop();
        if(vis[t.to]){
            continue;
        }
        ans+=t.w;
        left--;
        int u=t.to;
        vis[u]=1;
        for(int i=head[u];i;i=e[i].next){
            int v=e[i].to;
            if(!vis[v]){
                q.push(e[i]);
            }
        }
    }
    return ans;
}
int main(){
    scanf("%d %d",&n,&m);
    for(int i=1;i<=m;i++){
        int x,y,l;
        scanf("%d %d %d",&x,&y,&l);
        addedge(x,y,l);
        addedge(y,x,l);
    }
    int ans=prim();
    printf("%d",ans);
    return 0;
}

Kruskal
算法过程(来自百度百科):
先构造一个只含 n 个顶点、而边集为空的子图,把子图中各个顶点看成各棵树上的根结点,之后,从网的边集 E 中选取一条权值最小的边,若该条边的两个顶点分属不同的树,则将其加入子图,即把两棵树合成一棵树,反之,若该条边的两个顶点已落在同一棵树上,则不可取(会出现环),而应该取下一条权值最小的边再试之。依次类推,直到森林中只有一棵树,也即子图中含有 n-1 条边为止。
我的描述:
将边排序后,从小到大只要不形成环就加边,直到加够n-1条边为止。
正确性很显然,可以自己去看一下具体证明。
时间复杂度(暴力判环):低于O(m^2)
很明显,判环这里可以用并查集优化到近似O(1),那么算法的时间就都会集中在对边进行排序上,时间也就是排序的时间;
时间复杂度(并查集判环):O(mlogm)
这样的复杂度在稀疏图优于Prim,稠密图劣于Prim,自己酌情使用。
Kruskal的好处在于它极易编写,而Prim编写难度较高。


下来看代码吧:

//这题也是洛谷P3366,大家可以再写一次Kruskal交一次。
#include<bits/stdc++.h>
#define inf 2000000000
using namespace std;
struct edge{
    int a,b,w;
}e[200001];
int n,m;
int f[5001];
int sum=0;
int find(int x){ //并查集
    return x==f[x]?x:f[x]=find(f[x]);
}
void add(int i,int x,int y,int l){
    e[i].w=l;
    e[i].a=x;
    e[i].b=y;
}
int cmp(edge x,edge y){
    return x.w<y.w;
}
int main(){
    cin>>n>>m;
    for(int i=1;i<=n;i++){
        f[i]=i;
    }
    for(int i=1;i<=m;i++){
        int x,y,l;
        scanf("%d %d %d",&x,&y,&l);
        add(i,x,y,l);
    }
    sort(e+1,e+m+1,cmp);
    int tot=0;
    //Kruskal的主体只有这一个循环
    for(int i=1;i<=m&&tot<=n-1;i++){
        if(find(e[i].a)!=find(e[i].b)){ //判环
            sum+=e[i].w;
            f[find(e[i].a)]=find(e[i].b);
            tot++;
        }
    }
    if(tot==n-1){
        cout<<sum;
    }
    else{
        cout<<"orz";
    }
    return 0;
}

交了之后不出意外应该是Kruskal略快于Prim,这是因为这题m较小。
不过,Kruskal一般情况都足够了,具体看数据范围。
以上便是我对最小生成树的总结。
end

posted @ 2017-08-08 00:58  玫葵之蝶  阅读(237)  评论(0编辑  收藏  举报