KM 最优匹配 讲解
转:
基本原理
该算法是通过给每个顶点一个标号(叫做顶标)来把求最大权匹配的问题转化为求完备匹配的问题的。设顶点Xi的顶标为A[ i ],顶点Yj的顶标为B[ j ],顶点Xi与Yj之间的边权为w[i,j]。在算法执行过程中的任一时刻,对于任一条边(i,j),A[ i ]+B[j]>=w[i,j]始终成立。
KM算法的正确性基于以下定理:
若由二分图中所有满足A[ i ]+B[j]=w[i,j]的边(i,j)构成的子图(称做相等子图)有完备匹配,那么这个完备匹配就是二分图的最大权匹配。
这个定理是显然的。因为对于二分图的任意一个匹配,如果它包含于相等子图,那么它的边权和等于所有顶点的顶标和;如果它有的边不包含于相等子图,那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。
初始时为了使A[ i ]+B[j]>=w[i,j]恒成立,令A[ i ]为所有与顶点Xi关联的边的最大权,B[j]=0。如果当前的相等子图没有完备匹配,就按下面的方法修改顶标以使扩大相等子图,直到相等子图具有完备匹配为止。
我们求当前相等子图的完备匹配失败了,是因为对于某个X顶点,我们找不到一条从它出发的交错路。这时我们获得了一棵交错树,它的叶子结点全部是X顶点。现在我们把交错树中X顶点的顶标全都减小某个值d,Y顶点的顶标全都增加同一个值d,那么我们会发现:
1)两端都在交错树中的边(i,j),A[ i ]+B[j]的值没有变化。也就是说,它原来属于相等子图,现在仍属于相等子图。
2)两端都不在交错树中的边(i,j),A[ i ]和B[j]都没有变化。也就是说,它原来属于(或不属于)相等子图,现在仍属于(或不属于)相等子图。
3)X端不在交错树中,Y端在交错树中的边(i,j),它的A[ i ]+B[j]的值有所增大。它原来不属于相等子图,现在仍不属于相等子图。
4)X端在交错树中,Y端不在交错树中的边(i,j),它的A[ i ]+B[j]的值有所减小。也就说,它原来不属于相等子图,现在可能进入了相等子图,因而使相等子图得到了扩大。
现在的问题就是求d值了。为了使A[ i ]+B[j]>=w[i,j]始终成立,且至少有一条边进入相等子图,d应该等于:
Min{A[ i ]+B[j]-w[i,j] | Xi在交错树中,Yi不在交错树中}。
改进
以上就是KM算法的基本思路。但是朴素的实现方法,时间复杂度为O(n4)——需要找O(n)次增广路,每次增广最多需要修改O(n)次顶标,每次修改顶标时由于要枚举边来求d值,复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3)的。我们给每个Y顶点一个“松弛量”函数slack,每次开始找增广路时初始化为无穷大。在寻找增广路的过程中,检查边(i,j)时,如果它不在相等子图中,则让slack[j]变成原值与A[ i ]+B[j]-w[i,j]的较小值。这样,在修改顶标时,取所有不在交错树中的Y顶点的slack值中的最小值作为d值即可。但还要注意一点:修改顶标后,要把所有的不在交错树中的Y顶点的slack值都减去d。
Kuhn-Munkras算法流程:
(1)初始化可行顶标的值
(2)用匈牙利算法寻找完备匹配
(3)若未找到完备匹配则修改可行顶标的值
(4)重复(2)(3)直到找到相等子图的完备匹配为止
1 bool find(int x) 2 {//匈牙利算法寻找x的增广路径 3 //以x为根的M的交错树 4 //看来本算法需要二部图两部分的顶点个数都相等吧 5 int y, t; 6 visitx[x] = true; 7 for( y = 0; y < N; y++ ) 8 { 9 if( visity[y] ) continue;//找增广路径的过程中不妨问已经访问过的顶点 10 t = lx[x] + ly[y] - w[x][y];//是在等子图中寻找匹配的增广路径 11 if( t == 0 ) 12 { 13 visity[y] = true; 14 if( linky[y] == -1 || find(linky[y]) ) 15 { 16 linky[y] = x; 17 return true; 18 } 19 } 20 else 21 {//因为本来就需要将一条x顶点在交错树中,y顶点不在交错树中的边扩展进交错树来 22 //所以只改变这些不在等子图中的边的y顶点的松弛量 23 if( slack[y] > t ) 24 slack[y]=t; 25 } 26 } 27 return false; 28 } 29 //外层的匈牙利算法需要O(2)的时间,而修改顶标时由于要枚举所有的边所以也需要O(2)的时间 30 //所以总时间是O(4) 31 //引入松弛量以后改变顶标就不需要枚举每一条边,只需要枚举不在交错树中的y的松弛量,所以 32 //时间复杂度降为O(3) 33 void KM() 34 {//KM算法寻找图的最大权匹配 35 int i, j, x, d; 36 memset(linky,-1,sizeof(linky)); 37 memset(lx,0,sizeof(lx)); //x的顶标 38 memset(ly,0,sizeof(ly));//y的顶标 39 for( i = 0; i < N; i++) 40 for( j = 0; j < N; j++ ) 41 if( map[i][j] > lx[i] ) 42 lx[i] = map[i][j];//一开始x的顶标为所有与x相连的边中权值最大的边的权值,y的顶标为0 43 for( x = 0; x < N; x++ ) 44 {//在匈牙利算法中从每个x出发寻找增广路,如果找到就在匹配值上加1,这是为了寻找最大匹配 45 //而在此处,必须找到完备匹配,所以对于每一个x中的顶点,找到其增广路就跳出,找不到的话 46 //就需要修改顶标值直至找到为止 47 for( i = 0; i < N; i++ ) 48 slack[i] = INF;//松弛变量 49 while (true) 50 {//无限循环直至找到完备匹配 51 memset(visitx, 0, sizeof(visitx));//visx为真表示的是该顶点是匹配中的顶点 52 memset(visity, 0, sizeof(visity));//y同理 53 if( find(x) ) break; 54 d = INF; 55 for( i = 0; i < N; i++) 56 { 57 if ( !visity[i] )//注意是取所有不在交错树中的y顶点的松弛量的最小值作为d的值 58 if ( d > slack[i] ) 59 d = slack[i]; 60 } 61 for( i = 0; i < N; i++ ) 62 { 63 if( visitx[i] ) 64 lx[i] -= d; 65 } 66 for( i = 0; i < N; i++ ) 67 { 68 if( visity[i] ) 69 ly[i] += d; 70 else 71 slack[i] -= d; 72 } 73 } 74 } 75 }