数据结构与算法系列----最小生成树(Prim算法&Kruskal算法)
一:Prim算法
1.概览
普里姆算法(Prim算法)。图论中的一种算法。可在加权连通图里搜索最小生成树。意即由此算法搜索到的边子集所构成的树中。不但包含了连通图里的全部顶点(英语:Vertex (graph theory))。且其全部边的权值之和亦为最小。
该算法于1930年由捷克数学家沃伊捷赫·亚尔尼克(英语:Vojtěch Jarník)发现。并在1957年由美国计算机科学家罗伯特·普里姆(英语:Robert C. Prim)独立发现;1959年,艾兹格·迪科斯彻再次发现了该算法。
因此,在某些场合。普里姆算法又被称为DJP算法、亚尔尼克算法或普里姆-亚尔尼克算法。
2.算法简单描写叙述
1).输入:一个加权连通图。当中顶点集合为V,边集合为E。
2).初始化:Vnew = {x}。当中x为集合V中的任一节点(起始点)。Enew = {},为空;
3).反复下列操作,直到Vnew = V:
a.在集合E中选取权值最小的边<u, v>,当中u为集合Vnew中的元素,而v不在Vnew集合当中,而且v∈V(假设存在有多条满足前述条件即具有同样权值的边。则可随意选取当中之中的一个);
b.将v增加集合Vnew中。将<u, v>边增加集合Enew中;
4).输出:使用集合Vnew和Enew来描写叙述所得到的最小生成树。
3.算法的图例描写叙述
图例 | 说明 | 不可选 | 可选 | 已选(Vnew) |
---|---|---|---|---|
|
此为原始的加权连通图。每条边一側的数字代表其权值。 | - | - | - |
|
顶点D被随意选为起始点。顶点A、B、E和F通过单条边与D相连。 A是距离D近期的顶点, |
C, G | A, B, E, F | D |
下一个顶点为距离D或A近期的顶点。B距D为9,距A为7,E为15,F为6。因此, F距D或A近期,因此将顶点F与对应边DF以高亮表示。 |
C, G | B, E, F | A, D | |
算法继续反复上面的步骤。距离A为7的顶点B被高亮表示。 | C | B, E, G | A, D, F | |
在当前情况下,能够在C、E与G间进行选择。 C距B为8。E距B为7,G距F为11。 |
无 | C, E, G | A, D, F, B | |
这里。可供选择的顶点仅仅有C和G。 C距E为5,G距E为9。故选取C, |
无 | C, G | A, D, F, B, E | |
顶点G是唯一剩下的顶点。它距F为11。距E为9,E近期,故高亮表示G 及对应边EG。 |
无 | G | A, D, F, B, E, C | |
如今,全部顶点均已被选取,图中绿色部分即为连通图的最小生成树。 在此例中,最小生成树的权值之和为39。 |
无 | 无 | A, D, F, B, E, C, G |
4.简单证明prim算法
反证法:如果prim生成的不是最小生成树
1).设prim生成的树为G0
2).如果存在Gmin使得cost(Gmin)<cost(G0) 则在Gmin中存在<u,v>不属于G0
3).将<u,v>增加G0中可得一个环,且<u,v>不是该环的最长边(这是由于<u,v>∈Gmin)
4).这与prim每次生成最短边矛盾
5).故如果不成立。命题得证.
完整代码例如以下:
用邻接矩阵存储图,设置两个数组lowCost和adjIndex,当中前者代表边的权值,后者代表相应lowCost该边的起点。
#include<iostream> using namespace std; int graph[20][20];//邻接矩阵 char * vertex;//保存顶点 int Prim(int&); int main() { /* 6 10 A B C D E F 0 1 6 0 2 1 0 3 5 1 2 5 1 4 3 3 2 5 3 5 2 2 5 4 2 4 6 4 5 6 */ //////1.输入图的顶点数和弧数 cout << "请输入图的顶点数和弧数: "; int vexNum, arcNum; cin >> vexNum >> arcNum; //////2.初始化邻接矩阵 for (int i = 0; i < vexNum; i++) for (int j = 0; j < vexNum; j++) graph[i][j] = INT_MAX;//无限大 /////3.输入顶点 cout << "请输入" << vexNum << "个顶点信息: "; vertex = new char[vexNum]; for (int i = 0; i < vexNum; i++) cin >> vertex[i]; //////4.输入弧信息(边的方向和权值) cout << "请输入" << arcNum << "个弧的信息: \n"; int a, b, c; for (int i = 0; i < arcNum; i++) { cin >> a >> b >> c; graph[a][b] = c; graph[b][a] = c; } //////5.输出最小生成树 cout << "\n\n最小树为: \n"; int x = Prim(vexNum); cout << "\n最小权和为" << x << endl<<endl; return 0; } int Prim(int & _vexNum)//Prim最小生成树 { int * lowCost = new int[_vexNum];//保存边上的权值 int * adjIndex = new int[_vexNum];// for (int i = 1; i < _vexNum; i++) { lowCost[i] = graph[0][i]; adjIndex[i] = 0; } lowCost[0] = 0;//z这里用了一个技巧,赋值为0表示该点已增加生成树,以后不做处理,相当于常常碰见的visited标记数组,当然你也能够赋值为-1 adjIndex[0] = 0; int min, minIndex,sum=0; for (int i = 1; i < _vexNum; i++) { min = INT_MAX; for (int j = 1; j < _vexNum; j++)//找到权值最小 { if (lowCost[j] < min && lowCost[j]!=0) { min = lowCost[j]; minIndex = j; } } cout << vertex[adjIndex[minIndex]] << "------>" << vertex[minIndex] << endl; sum += min; lowCost[minIndex] = 0; adjIndex[minIndex] = 0; for (int j = 1; j < _vexNum; j++)//更新lowCost和adjIndex数组 { if (graph[minIndex][j] < lowCost[j]) { lowCost[j] = graph[minIndex][j]; adjIndex[j] = minIndex; } } } delete []lowCost; delete []adjIndex; return sum; }
以上代码所构建的图为:
执行例如以下:
二:Kruskal算法
1.概览
Kruskal克鲁斯卡尔算法是一种用来寻找最小生成树的算法,由Joseph Kruskal在1956年发表。
用来解决相同问题的还有Prim算法和Boruvka算法等。三种算法都是贪婪算法的应用。
和Boruvka算法不同的地方是,Kruskal算法在图中存在相同权值的边时也有效。
2.算法简单描写叙述
1).记Graph中有v个顶点,e个边
2).新建图Graphnew,Graphnew中拥有原图中同样的e个顶点。但没有边
3).将原图Graph中全部e个边按权值从小到大排序
4).循环:从权值最小的边開始遍历每条边。直至图Graph中全部的节点都在同一个连通分量中,if 这条边连接的两个节点于图Graphnew中不在同一个连通分量中。加入这条边到图Graphnew中。
3.图例描写叙述
首先第一步。我们有一张图Graph。有若干点和边
将全部的边的长度排序。用排序的结果作为我们选择边的根据。
这里再次体现了贪心算法的思想。资源排序。对局部最优的资源进行选择,排序完毕后。我们领先选择了边AD。
这样我们的图就变成了左图
在剩下的变中寻找。我们找到了CE。
这里边的权重也是5
依次类推我们找到了6,7,7,即DF。AB,BE。
以下继续选择, BC或者EF虽然如今长度为8的边是最小的未选择的边。可是如今他们已经连通了(对于BC能够通过CE,EB来连接,类似的EF能够通过EB,BA,AD,DF来接连)。所以不须要选择他们。类似的BD也已经连通了(这里上图的连通线用红色表示了)。
当然我们选择了EG。最后成功的图就是左图:
4.简单证明Kruskal算法
对图的顶点数n做归纳,证明Kruskal算法对随意n阶图适用。
归纳基础:
n=1。显然可以找到最小生成树。
归纳过程:
如果Kruskal算法对n≤k阶图适用,那么,在k+1阶图G中。我们把最短边的两个端点a和b做一个合并操作,即把u与v合为一个点v',把原来接在u和v的边都接到v'上去,这样就行得到一个k阶图G'(u,v的合并是k+1少一条边)。G'最小生成树T'可以用Kruskal算法得到。
我们证明T'+{<u,v>}是G的最小生成树。
用反证法:
如果T'+{<u,v>}不是最小生成树,最小生成树是T,即W(T)<W(T'+{<u,v>})。显然T应该包括<u,v>。否则,能够用<u,v>增加到T中,形成一个环,删除环上原有的随意一条边,形成一棵更小权值的生成树。而T-{<u,v>}。是G'的生成树。所以W(T-{<u,v>})<=W(T'),也就是W(T)<=W(T')+W(<u,v>)=W(T'+{<u,v>}),产生了矛盾。于是如果不成立,T'+{<u,v>}是G的最小生成树。Kruskal算法对k+1阶图也适用。由数学归纳法,Kruskal算法得证。
代码实现:
下面代码使用了并查集,关于并查集内容,请參考: http://blog.csdn.net/laojiu_/article/details/50769868
#include<iostream> #include<algorithm> using namespace std; struct Edge//表示一条边 { int u;//起始顶点 int v;//结尾顶点 int w;//该边的权值 }; bool cmp(Edge edge1, Edge edge2) { return (edge1.w < edge2.w); } Edge* edge;//存储边的数组 int* father; int vexNum, arcNum;//顶点数。边数 int Kruskal(); int Find(int x); void Join(int x, int y); int main() { /* 6 10 0 1 6 0 2 1 0 3 5 1 2 5 1 4 3 3 2 5 3 5 2 2 5 4 2 4 6 4 5 6 */ cout << "请输入图的顶点数和弧数: "; cin >> vexNum >> arcNum; father = new int[vexNum]; for (int i = 0; i < vexNum; i++) father[i] = i; cout << "请输入" << arcNum << "条边的信息:\n"; edge = new Edge[arcNum]; for (int i = 0; i < arcNum; i++) cin >> edge[i].u >> edge[i].v >> edge[i].w; cout << Kruskal() << endl; delete[]edge; delete[]father; return 0; } int Find(int x) { return (x == father[x]) ? x : Find(father[x]); } void Join(int x, int y) { int root_x = Find(x); int root_y = Find(y); if (root_x != root_y) father[root_x] = root_y; } int Kruskal() { int sum = 0;//最小路径权值和 int finished = 0;//最小生成树的边数应该是顶点数-1,在此设置变量标记是否完毕 sort(edge, edge + arcNum, cmp); for (int i = 0; i < arcNum&&finished < vexNum - 1; i++) { int root_u = Find(edge[i].u); int root_v = Find(edge[i].v); if (root_u != root_v) { Join(edge[i].u, edge[i].v); finished++; cout << edge[i].u << "----->" << edge[i].v << endl; sum += edge[i].w; } } return sum; }
数据測试在代码里,方便读者測试程序的正确性。如有错误。请指出,感谢!
返回文件夹---->数据结构与算法文件夹
參考链接和图片资源来自:
严蔚敏的数据结构。
http://blog.csdn.net/yeruby/article/details/38615045。
http://www.cnblogs.com/biyeymyhjob/archive/2012/07/30/2615542.html。