最大二分匹配

1.如果图G的顶点集V(G)能分成两个不想交的非空子集X和Y,使得G的每条边的两个端点分别在X和Y中,则称G为二分图。直观的讲就是X中的点互不邻接,Y中的点也互不邻接,而只有X和Y之间有边相邻的图。图1就是一个二分图:

最大二分匹配 - chhaj5236 - chhaj5236的博客最大二分匹配 - chhaj5236 - chhaj5236的博客

                        图一                                                                    图二

      2.如果G的边集E(G)中有个子集M,满足M中的任何两条边都不邻接,则M就是图G的一个匹配。包含边数最多的匹配称为最大匹配,最大匹配所包含的边数称为最大匹配数。当G是二分图时,问题就比较特殊了,这就是我们后面要解决的问题——最大二分匹配。图二就是图一对应的一个最大二分匹配。

      3.求解最大二分匹配可以通过网络流也可以通过匈牙利算法,下面我将会说明这两种方法的主要思想。


 

      最大二分匹配可以很容易地转换成最大流问题,利用Ford-Fulkerson方法可以在关于|V|和|E|的多项式时间内,找出无向图G=(V,E)的最大匹配。解决这一问题的关键在于建立一个流网络,我们在原二分图的基础上引入两个新的节点s和t,分别作为源点和汇点,并重新构造整个流网络的边,将原二分图中的所有无向边(u,v)改成是从u指向v,并添加从s到X集合中所有顶点的有向边以及从Y集合中所有顶点到t的有向边,如图三:

最大二分匹配 - chhaj5236 - chhaj5236的博客

                                                                图三

      最后将新图中的所有有向边的容量赋值为1,此时这个流网络对应的最大流的值和原二分图的最大匹配数就是相等的了。因为每条边的容量都是1,如果有一条增广路径是最大流的组成部分,那么这条路径贡献的流值就是1,而当贡献完这仅有的1个流值后,这条增光路径上的任何一条边从源点到汇点的方向就不再连通了。根据这个特性和二分图的特性,最大流f一定是由|f|条从s到t的互不相交的增广路径组成的,且每条增广路径的贡献均为1。观察图三,假设已知图三中二分图的某个最大匹配M,那么我们可以取最大匹配中的每条边、s与边在X中顶点的连线以及t与边在Y中的顶点的连线,显然这就组成了一个值为|M|的流。如果在该流网络中还存在一个比|M|更大的流|f|的话,我们显然可以将每条增广路径包含s和包含t的边去掉,而必定剩下|f|条互不相邻的边,且这|f|条边是满足匹配的条件的,就与|M|是最大匹配矛盾了,所以经过之前所讲的变化后就可以得到一个最大流与原二分图最大二分匹配相等的流网络了。具体实现参考Ford-Fulkerson求解最大流

 

 


 

       在介绍匈牙利算法之前还是先提一下几个概念,下面M是G的一个匹配。
      M-交错路:p是G的一条通路,如果p中的边为属于M中的边与不属于M但属于G中的边交替出现,则称p是一条M-交错路。如:路径(X3,Y2,X1,Y4),(Y1,X2,Y3)。
      M-饱和点:对于v∈V(G),如果v与M中的某条边关联,则称v是M-饱和点,否则称v是非M-饱和点。如X1,X2,Y1,Y2都属于M-饱和点,而其它点都属于非M-饱和点。
      M-可增广路:p是一条M-交错路,如果p的起点和终点都是非M-饱和点,则称p为M-可增广路。如(X3,Y2,X1,Y4)。(不要和流网络中的增广路径弄混了)

最大二分匹配 - chhaj5236 - chhaj5236的博客

    图四

      由于M-交错路由属于M和不属于M的边交替组成的,而M-可增广路的起始边和结束边都不属于M,所以M-可增广路的长度必定是奇数。假设p中属于M中边的条数为n,那么不属于M中的边就是n+1条,当找到p这条M-可增广路时,我们就将匹配由原来的M换成不属于M的n+1条边,显然这n+1条边也是符合匹配条件的,且比原匹配要大1。根据M-可增广路的这个性质,我们可以很容易的得到一个定理:图G的匹配M是最大匹配当且仅当G中不存在M-可增广路

     匈牙利算法的本质思想就在于上面的定理,在图中寻找一条可增广路p,并将p中的边进行上述转换,得到一个新的匹配,然后再重复直到找不到可增广路为止。在具体实现时,我们从X集合中的点依次出发寻找可增广路,这样就能保证每次开始的起始点都是非M-饱和点,而对于Y集合中的点,我们维护一个数组match,如果match[i]不等于给定的初始值,就说明Y中标号为i的点与匹配M中的一条边关联,且另一个顶点在X中的标号为match[i]。所以当我们从X中的顶点u搜索可增光路时,如果与u相连的v还没有被匹配,那么肯定可以将(u,v)并入匹配M中,否则就通过(u,v,match[v])这条M-交错路回到X集合中,再从match[v]继续搜索。如果能够找到可增广路,就根据可增广路更新match数组。

      这里还有一个问题,依次对X中的点进行上述的操作,会不会出现从某一个顶点找不到可增广路,但是经过后操作顶点对匹配的更新,而导致再从这个顶点出发又可以找到可增广路了呢?答案是不会。假设经过后操作顶点更新后,顶点u原本找不到可增广路,而现在对应了一条可增广路p,我们假设在第一次对u查找时与p中的一一对应的不可增广路为p',那么这条可增广路肯定是将p'中的某段M-交错路反向得到的。那么在这段M-交错路的左右相邻的两条边是什么情况呢,由于p'不是可增广路,所以左边和右边肯定分别和M-交错路的左右两边一条属于匹配M一条不属于,那么在反向后肯定就会在左右两边出现要不都属于M要不都不属于M,而由于p是一条可增广路,所以都属于的情况是不会出现的,只有都不属于,那么就会出现M-交错路加上左右两条边后,就形成了一条可增广路,显然这与p'是非可增广路矛盾了。这个证明比较绕,我也想了很久,可以画几个图来看一下,就会比较好理解了。

匈牙利算法实现代码如下:

//MAXN表示X集合中点的最大个数,MAXM表示Y集合中点的最大个数
//n表示X集合中点的实际个数,m表示Y集合中点的实际个数

bool path[MAXN] [MAXM],visit[MAXM];   //path[i] [j]=true说明i到j有一条边
int match[MAXM];   //与Y中的点匹配的点标识,初始化为-1

bool SearchPath(int s,int m){
    for(int i=0;i<m;i++){
        if(path[s] [i]&&!visit[i]){   //如果从s到i有边且Y中的i点没有被访问过
            visit[i]=true;
            if(match[i]==-1 || SearchPath(match[i],m)){   //查找可增广路并更新match数组
                match[i]=s;
                return true;
            }
        }
    }
    return false;
}

在主函数中使用下面的代码就可以得到最大匹配数了

sum=0;
for(i=0;i<n;i++){
    memset(visit,0,sizeof(visit));
    if(SearchPath(i,m))sum++;

posted @ 2011-12-13 10:38  张兰云  阅读(490)  评论(0编辑  收藏  举报