克鲁斯卡尔(Kruskal)算法
概览
相比于普里姆算法(Prim算法),克鲁斯卡尔算法直接以边为目标去构建最小生成树。从按权值由小到大排好序的边集合{E}中逐个寻找权值最小的边来构建最小生成树,只要构建时,不会形成环路即可保证当边集合{E}中的边都被尝试了过后所形成的树为最小生成树。
定义
假设G=(V, {E})是连通网(即带权连通图),则令最小生成树的初始状态为只有N个顶点而无边的非连通图T=(V, {}),图T中每个顶点自成一个连通分量。在图G的边集{E}中选择权值最小的边e,若e依附的顶点落在T中不同的连通分量上,则将e加入到T中,否则舍去e而选择下一条权值最小的边。以此类推,直至T中所有顶点都在同一连通分量上为止。
相关概念
连通:在无向图G中,如果从顶点v到v’有路径,则称v和v’是连通的。
连通图:如果对于图G中任意两个顶点vi、vj∈E,vi和vj都是连通的,则称G是连通图。
过程简述
输入:带权连通图(网)G的边集E及顶点个数。(E已按权值的升序排序。)
初始:T=(V, {}), V是图G的顶点集合且各顶点自成一个连通分量;表示边的集合为空{}。
操作:重复以下操作,直到T中所有顶点都在同一个连通分量上。
- 依次取E中一条边e(边e必为未尝试过的边中权值最小的边。因为{E}已按权值升序排序)。
- 将e的两个顶点分别放入T的各连通分量集合V中以测试该顶点是否分别在不同连通分量中。
- 设存在一个方法/函数Find(V, vertex),从连通分量集合V的vertex顶点开始沿该连通分量查找,返回以vertex开始的连通分量的最后一个顶点(的下标)。令n=Find(V, e.begin)和m=Find(V, e.end),若n≠m则e存在于T的不同连通分量中,故将e.end加入到以e.begin开始的连通分量中去。(注:e.begin表示e的开始顶点;e.end表示e的结束顶点;虽然无向图的边不存在开始顶点或结束顶点,但是作为程序表示,也得有两个值来表示边的两个顶点。)(为什么n≠m则两个顶点分别位于不同的连通分量中?若v1、v4、v6位于同一个连通分量,v3、v7位于另一个连通分量。那么怎么表示这两个连通分量呢?可以用一个数组来表示!数组的索引本身即是顶点v的下标,而v在数组中对应的存储单元存有构成该连通分量的下一个顶点v’。用一个数组parent表示图T的V。那么parent[1]=4,parent[4]=6,parent[6]=0,0表示该连通图中已无别的顶点;parent[3]=7,parent[7]=0。对于边(1, 6)(或(6, 1)),将1带入parent数组,最终会沿着连通图找到n=6;将6带入parent数组,最终会沿着连通图找到m=6。n=m所以这两个顶点位于相同连通图中。而对于边(4, 7)(或(7, 4)),将4带入parent数组,得到n=6;将7带入parent数组,得到m=7。n≠m所以两个顶点位于不同连通图中。把点v7所处的连通图放入v1、v4、v6构成的连通图中:parent[6]=7(parent[n]=m)反过来点v4所处的连通图放入v3、v7构成的连通图中,即parent[7]=6也行,只采用两者之一即可。)
- 直到T中所有顶点都在同一连通分量上为止。(E中的每一条边都尝试一遍即可。)
输出:最小生成树。
如何实现
输入:用Edge类表示边,其中Begin/End/Weight域分别表示边的两个顶点的下标及权重。Edge数组E表示边集,N表示顶点个数。(E已按权值的升序排序。)
初始:用包含N个存储单元的数组parent表示T=(V, {})的 V,即各顶点自成的连通分量。parent数组的下标i即为顶点的下标,i处存放的值parent[i]即为连通分量中下一个顶点的下标,parent[i]=0表示该连通分量已结束。将parent的各存储单元初始化为0。
操作:重复以下操作,直到T中所有顶点都在同一个连通分量上。
- 依次取E中一条边e。
- 将e.Begin和e.End带入parent数组,找到连通分量中的最后一个顶点。n=Find(parent, e.Begin)和m=Find(parent, e.end),若n≠m则e存在于T的不同连通分量中,故将点e.End所处的连通图加入到点e.Begin所处的连通图中去,即parent[n]=m。(反过来parent[m]=n也行。)
- 直到E中的每一条边都尝试一遍即可。
输出:最小生成树。
如上面的这个图G=(V, {E}),其中V={v0, v1, v2, v3, v4, v5, v6, v7, v8},E= {(v4, v7, 7), (v2, v8, 8), (v0, v1, 10), (v0, v5, 11), (v1, v8, 12), (v3, v7, 16), (v1, v6, 16), (v5, v6, 17), (v1, v2, 18), (v6, v7, 19), (v3, v4, 20), (v3, v8, 21), (v2, v3, 22), (v3,v6, 24), (v4, v5, 26)}
用一个边集来表示该图G,得上图右边的数组。
① 输入:带权连通图G=(V, {E})的边集合及顶点数目,求图G的最小生成树。
② 初始:T={V, {}},用数组parent=int[9]来表示V,parent数组记录的是以索引i表示的顶点开始到parent[i]表示的顶点构成的连通图。例如:(parent数组本身就含有两个信息:索引和索引处的值,vertex数组是不存在的,只是为了辅助理解。)
非连通图头顶点下标vertex:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标parent:[ 0, 0, 8, 0, 7, 0, 0, 0, 0 ]
parent[2]=8,parent[8]=0即顶点v2、v8构成一个连通分量。
parent[4]=7,parent[7]=0即顶点v4、v7构成一个连通分量。
③ 操作:
1.上图中,边(4, 7, 7)权值最小,取该边为e。
2. 此时parent[4]=0,故n=4;parent[7]=0,故m=7;n≠m故parent[4]=7,将{v4}和{v7}这两个连通图合并为一个连通图。执行后parent数组如下:
非连通图头顶点下标vertex:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标parent:[ 0, 0, 0, 0, 7, 0, 0, 0, 0 ]
解释:parent[2]=0,即v2自成一个连通图。parent[4]=7,parent[7]=0即v4所在连通图中还有v7,v7接下来没有别的顶点了,即v4、v7在同一个连通图中。
3.从E中取下一条边继续上面1、2步骤的操作。
④输出:
演示过程
(4,7) = 7
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 0, 0, 0, 0, 7, 0, 0, 0, 0 ]
(2,8) = 8
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 0, 0, 8, 0, 7, 0, 0, 0, 0 ]
(0,1) = 10
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 0, 8, 0, 7, 0, 0, 0, 0 ]
(0,5) = 11
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 5, 8, 0, 7, 0, 0, 0, 0 ]
(1,8) = 12
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 5, 8, 0, 7, 8, 0, 0, 0 ]
(3,7) = 16
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 5, 8, 7, 7, 8, 0, 0, 0 ]
(1,6) = 16
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 5, 8, 7, 7, 8, 0, 0, 6 ]
(6,7) = 19
非连通图头顶点下标:[ 0, 1, 2, 3, 4, 5, 6, 7, 8 ]
非连通图尾顶点下标:[ 1, 5, 8, 7, 7, 8, 7, 0, 6 ]
运行结果
(4, 7) = 7
(2, 8) = 8
(0, 1) = 10
(0, 5) = 11
(1, 8) = 12
(3, 7) = 16
(1, 6) = 16
(6, 7) = 19
算法代码
见链接:克鲁斯卡尔(Kruskal)算法(代码) - kokiafan - 博客园 (cnblogs.com)
复杂度
它的时间复杂度为O(eloge)(e为网中的边数),所以,适合于求边稀疏的网的最小生成树。
参考资料:
《大话数据结构》 - 程杰 著 - 清华大学出版社 第252页