图论(五)------最小生成树
一个无向图G的最小生成树就是由该图的那些连接了G的所有顶点的边构成的树,且其总权重最低。最小生成树存在当且仅当G是连通的。
对于任何一生成树T,如果将一条不属于T的边e加进来,则产生一个圈。如果从圈中除去任意一条边,则又恢复树的特性。如果边e的权值比除去的边的值低,那么新生成的树的值就比原生成的树的值低。如果在建立树T的过程中每次添加的边在所有避免成圈的边中值最小,那么最后得到的生成树的值不能再改进。对于最小生成树的贪婪算法是成立的。
算法策略
在每一个步骤中都形成最小生成树的一条边。算法维护一个边的集合A,保持以下的循环不变式:
在每一次循环迭代之前,A是某个最小生成树的一个子集。
在算法的每一步中,确定一条边(u,v),使得它加入到A后,仍然不违反这个循环不变式,即A与{(u,v)}的并集仍然是某一个最小生成树的子集。称这样的边为A的安全边。
根据确定安全边的方法,有两种最小生成树算法:
Prim算法
使最小生成树一步步成长,每一步都把一个节点当做根并往上加边。在算法的任一时刻,都可以看到一个已添加到树上的顶点集。每一阶段,选择一条边(u,v)使得此条边的权值是所有u在树上但v不在树上的边的值中的最小者。对每一个顶点保留值dv和pv,dv是连接顶点v到已加入树上的顶点集的最短边的权,pv是导致dv改变的最后的顶点。可见Prim算法基本上和Dijkstra算法基本是一样的,只是dv定义有所不同,在Dijkstra算法中dv是v到源点的最短边。
一个互联网广播的例子:
将所有顶点加入到队列Q中:
将A选为源点,A出队列Q,加入到树T中,更新B,C的d值:
最小边为(A,B),将B移出Q,加入到树T中,更新CDE的d值
以此类推,得到结果:
代码:
def Prim(G,s): path={} pre={} alist=[] for v in G: alist.append(v) path[v]=sys.maxsize pre[v]=s path[s]=0 queue=PriorityQueue(path) queue.buildHeap(alist) while queue.size>0: vertex=queue.delMin() for v in vertex.getNeighbors(): newpath=vertex.getWeight(v) if v in queue.queue and newpath<path[v]: path[v]=newpath pre[v]=vertex queue.perUp(v) return pre if __name__=='__main__': g= Graph() g.addEdge('a','b',2) g.addEdge('b','a',2) g.addEdge('a','c',3) g.addEdge('c','a',3) g.addEdge('b','c',1) g.addEdge('c','b',1) g.addEdge('b','d',1) g.addEdge('d','b',1) g.addEdge('d','e',1) g.addEdge('e','d',1) g.addEdge('b','e',4) g.addEdge('e','b',4) g.addEdge('c','f',5) g.addEdge('f','c',5) g.addEdge('e','f',1) g.addEdge('f','e',1) g.addEdge('f','g',1) g.addEdge('g','f',1) u=g.getVertex('a') path=Prim(g,u) for v in path: print v.id,' after ',path[v].id 输出: a after a b after a c after b d after b e after d f after e g after f
Prim算法是在无向图上运行的,记住把每一条边都加入到两个邻接表中。不用堆时运行时间为O(|V|2),使用二叉堆的运行时间是O(|E|log|V|)。
Kruskal算法
连续的按照最小的权选择边,并且在当所选的边不产生圈时把它作为选定的边。形式上Kruskal算法是在处理一个森林——树的集合,该算法找出森林中连接任意两棵树的所有边中,具有最小权值的边作为安全边。一开始,存在|V|棵单节点树,添加边则将两棵树合并为一棵树。算法终止的时候就剩下一棵树了,这棵树就是最小生成树。此算法用不相交集合的Union/Find算法确定安全边。对于一条边(u,v),如果u和v在同一集合中,那么就要放弃此边,因为他们已经连通了,再添加此边就会形成一个圈。
选取边时可以根据边的权值将边排序,然后从小到大选取边,不过建堆是更好的想法。
class Vertex(object): def __init__(self,key): self.id=key self.adj={} self.parent=None self.rank=0 def addNeighbor(self,nbr,weight=0): self.adj[nbr]=weight def getNeighbors(self): return self.adj.keys() def getId(self): return self.id def getWeight(self,key): return self.adj[key] def Kruskal(G): elist=[] accpeted_e_list=[] for v in G: for vertex in v.getNeighbors(): e=Edge(v,vertex,v.getWeight(vertex)) elist.append(e) queue=KruskalQueue(elist) queue.buildHeap() edge_num=0 while edge_num<G.size-1: e=queue.delMin() u=e.u v=e.v uset=Find(u) vset=Find(v) if uset!=vset: accpeted_e_list.append(e) edge_num+=1 Union(uset,vset) return accpeted_e_list class Edge(object): def __init__(self,u,v,weight): self.u=u self.v=v self.weight=weight class KruskalQueue(object): def __init__(self,elist): self.elist=elist self.size=len(self.elist) def buildHeap(self): for i in xrange(self.size/2-1,-1,-1): self.perDown(i) def delMin(self): self.elist[0],self.elist[-1]=self.elist[-1],self.elist[0] e=self.elist.pop() self.size-=1 self.perDown(0) return e def perDown(self,i): left=2*i+1 right=2*i+2 little=i if left<=self.size-1 and self.elist[i].weight>self.elist[left].weight: little=left if right<=self.size-1 and self.elist[little].weight>self.elist[right].weight: little=right if little!=i: self.elist[i],self.elist[little]=self.elist[little],self.elist[i] self.perDown(little) def perUp(self,i): if i>0 and self.elist[i].weight<self.elist[(i-1)/2].weight: self.elist[i],self.elist[(i-1)/2]=self.elist[(i-1)/2],self.elist[i] self.perUp((i-1)/2) def Find(v): if v.parent is None: return v else: v.parent=Find(v.parent) return v.parent def Union(u,v): if u.rank<=v.rank: u.parent=v if u.rank==v.rank: v.rank+=1 else: v.parent=u if __name__=='__main__': g= Graph() g.addEdge('a','b',2) g.addEdge('a','c',3) g.addEdge('b','c',1) g.addEdge('b','d',1) g.addEdge('d','e',1) g.addEdge('b','e',4) g.addEdge('f','c',5) g.addEdge('f','e',1) g.addEdge('g','f',1) elist=Kruskal(g) for e in elist: print 'edge(%s,%s)'%(e.u.id,e.v.id)
输出:
>>> edge(b,c) edge(f,e) edge(b,d) edge(g,f) edge(d,e) edge(a,b)
算法的最坏情况是O(|E|log|E|),受堆操作控制。图稠密的时候,E=O(V2),实际运行时间为O(ElogV)。