图论(五)------最小生成树

一个无向图G的最小生成树就是由该图的那些连接了G的所有顶点的边构成的树,且其总权重最低。最小生成树存在当且仅当G是连通的。

对于任何一生成树T,如果将一条不属于T的边e加进来,则产生一个圈。如果从圈中除去任意一条边,则又恢复树的特性。如果边e的权值比除去的边的值低,那么新生成的树的值就比原生成的树的值低。如果在建立树T的过程中每次添加的边在所有避免成圈的边中值最小,那么最后得到的生成树的值不能再改进。对于最小生成树的贪婪算法是成立的。

算法策略

在每一个步骤中都形成最小生成树的一条边。算法维护一个边的集合A,保持以下的循环不变式:

在每一次循环迭代之前,A是某个最小生成树的一个子集。

在算法的每一步中,确定一条边(u,v),使得它加入到A后,仍然不违反这个循环不变式,即A与{(u,v)}的并集仍然是某一个最小生成树的子集。称这样的边为A的安全边。

根据确定安全边的方法,有两种最小生成树算法:

Prim算法

使最小生成树一步步成长,每一步都把一个节点当做根并往上加边。在算法的任一时刻,都可以看到一个已添加到树上的顶点集。每一阶段,选择一条边(u,v)使得此条边的权值是所有u在树上但v不在树上的边的值中的最小者。对每一个顶点保留值dv和pv,dv是连接顶点v到已加入树上的顶点集的最短边的权,pv是导致dv改变的最后的顶点。可见Prim算法基本上和Dijkstra算法基本是一样的,只是dv定义有所不同,在Dijkstra算法中dv是v到源点的最短边。

一个互联网广播的例子:

将所有顶点加入到队列Q中:

将A选为源点,A出队列Q,加入到树T中,更新B,C的d值:

最小边为(A,B),将B移出Q,加入到树T中,更新CDE的d值

以此类推,得到结果:

代码:

def Prim(G,s):
    path={}
    pre={}
    alist=[]
    for v in G:
        alist.append(v)
        path[v]=sys.maxsize
        pre[v]=s
    path[s]=0
    queue=PriorityQueue(path)
    queue.buildHeap(alist)
    while queue.size>0:
        vertex=queue.delMin()
        for v in vertex.getNeighbors():
            newpath=vertex.getWeight(v)
            if v in queue.queue and newpath<path[v]:
                path[v]=newpath
                pre[v]=vertex
                queue.perUp(v)                
    return pre
if __name__=='__main__':
    g= Graph()
    g.addEdge('a','b',2)
    g.addEdge('b','a',2)
    g.addEdge('a','c',3)
    g.addEdge('c','a',3)
    g.addEdge('b','c',1)
    g.addEdge('c','b',1)
    g.addEdge('b','d',1)
    g.addEdge('d','b',1)
    g.addEdge('d','e',1)
    g.addEdge('e','d',1)
    g.addEdge('b','e',4)
    g.addEdge('e','b',4)
    g.addEdge('c','f',5)
    g.addEdge('f','c',5)
    g.addEdge('e','f',1)
    g.addEdge('f','e',1)
    g.addEdge('f','g',1)
    g.addEdge('g','f',1)
    u=g.getVertex('a')
    path=Prim(g,u)
    for v in path:
        print v.id,' after ',path[v].id
输出:
a  after  a
b  after  a
c  after  b
d  after  b
e  after  d
f  after  e
g  after  f

Prim算法是在无向图上运行的,记住把每一条边都加入到两个邻接表中。不用堆时运行时间为O(|V|2),使用二叉堆的运行时间是O(|E|log|V|)。

Kruskal算法

连续的按照最小的权选择边,并且在当所选的边不产生圈时把它作为选定的边。形式上Kruskal算法是在处理一个森林——树的集合,该算法找出森林中连接任意两棵树的所有边中,具有最小权值的边作为安全边。一开始,存在|V|棵单节点树,添加边则将两棵树合并为一棵树。算法终止的时候就剩下一棵树了,这棵树就是最小生成树。此算法用不相交集合的Union/Find算法确定安全边。对于一条边(u,v),如果u和v在同一集合中,那么就要放弃此边,因为他们已经连通了,再添加此边就会形成一个圈。

选取边时可以根据边的权值将边排序,然后从小到大选取边,不过建堆是更好的想法。

class Vertex(object):
    def __init__(self,key):
        self.id=key
        self.adj={}
        self.parent=None
        self.rank=0
    def addNeighbor(self,nbr,weight=0):
        self.adj[nbr]=weight
    def getNeighbors(self):
        return self.adj.keys()
    def getId(self):
        return self.id
    def getWeight(self,key):
        return self.adj[key]
def Kruskal(G):
    elist=[]
    accpeted_e_list=[]
    for v in G:
        for vertex in v.getNeighbors():
            e=Edge(v,vertex,v.getWeight(vertex))
            elist.append(e)
    queue=KruskalQueue(elist)
    queue.buildHeap()
    edge_num=0
    while edge_num<G.size-1:
        e=queue.delMin()
        u=e.u
        v=e.v
        uset=Find(u)
        vset=Find(v)
        if uset!=vset:
            accpeted_e_list.append(e)
            edge_num+=1
            Union(uset,vset)
    return accpeted_e_list      
class Edge(object):
    def __init__(self,u,v,weight):
        self.u=u
        self.v=v
        self.weight=weight
class KruskalQueue(object):
    def __init__(self,elist):
        self.elist=elist
        self.size=len(self.elist)
    def buildHeap(self):
        for i in xrange(self.size/2-1,-1,-1):
            self.perDown(i)
    def delMin(self):
        self.elist[0],self.elist[-1]=self.elist[-1],self.elist[0]
        e=self.elist.pop()
        self.size-=1
        self.perDown(0)
        return e
    def perDown(self,i):
        left=2*i+1
        right=2*i+2
        little=i
        if left<=self.size-1 and self.elist[i].weight>self.elist[left].weight:
            little=left
        if right<=self.size-1 and self.elist[little].weight>self.elist[right].weight:
            little=right
        if little!=i:
            self.elist[i],self.elist[little]=self.elist[little],self.elist[i]
            self.perDown(little)
    def perUp(self,i):
        if i>0 and self.elist[i].weight<self.elist[(i-1)/2].weight:
            self.elist[i],self.elist[(i-1)/2]=self.elist[(i-1)/2],self.elist[i]
            self.perUp((i-1)/2)        
def Find(v):
    if v.parent is None:
        return v
    else:
        v.parent=Find(v.parent)
        return v.parent
def Union(u,v):
    if u.rank<=v.rank:
        u.parent=v
        if u.rank==v.rank:
            v.rank+=1
    else:
        v.parent=u    
if __name__=='__main__':
    g= Graph()
    g.addEdge('a','b',2)
    g.addEdge('a','c',3)
    g.addEdge('b','c',1)
    g.addEdge('b','d',1)
    g.addEdge('d','e',1)
    g.addEdge('b','e',4)
    g.addEdge('f','c',5)
    g.addEdge('f','e',1)
    g.addEdge('g','f',1)
    elist=Kruskal(g)
    for e in elist:
        print 'edge(%s,%s)'%(e.u.id,e.v.id)

输出:

>>> 
edge(b,c)
edge(f,e)
edge(b,d)
edge(g,f)
edge(d,e)
edge(a,b)

算法的最坏情况是O(|E|log|E|),受堆操作控制。图稠密的时候,E=O(V2),实际运行时间为O(ElogV)。

posted @ 2014-07-24 22:19  再见紫罗兰  阅读(1845)  评论(0编辑  收藏  举报