这个算法的本质还是不断的找增广路;
KM算法的正确性基于以下定理:
若由二分图中所有满足A[i]+B[j]=w[i,j]的边(i,j)构成的子图(称做相等子图)有完备匹配,那么这个完备匹配就是二分图的最大权匹配。
这个定理是显然的。因为对于二分图的任意一个匹配,如果它包含于相等子图,那么它的边权和等于所有顶点的顶标和;如果它有的边不包含于相等子图,那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。
(1)可行点标:每个点有一个标号,记lx[i]为X方点i的标号,ly[j]为Y方点j的标号。如果对于图中的任意边(i, j, W)都有lx[i]+ly[j]>=W,则这一组点标是可行的。特别地,对于lx[i]+ly[j]=W的边(i, j, W),称为可行边;
(2)KM算法的核心思想就是通过修改某些点的标号(但要满足点标始终是可行的),不断增加图中的可行边总数,直到图中存在仅由可行边组成的完全匹配为止,此时这个匹配一定是最佳的(因为由可行点标的的定义,图中的任意一个完全匹配,其边权总和均不大于所有点的标号之和,而仅由可行边组成的完全匹配的边权总和等于所有点的标号之和,故这个匹配是最佳的)。一开始,求出每个点的初始标号:lx[i]=max{e.W|e.x=i}(即每个X方点的初始标号为与这个X方点相关联的权值最大的边的权值),ly[j]=0(即每个Y方点的初始标号为0)。这个初始点标显然是可行的,并且,与任意一个X方点关联的边中至少有一条可行边;
(3)然后,从每个X方点开始DFS增广。DFS增广的过程与最大匹配的Hungary算法基本相同,只是要注意两点:一是只找可行边,二是要把搜索过程中遍历到的X方点全部记下来(可以用vst搞一下),以进行后面的修改;
(4)增广的结果有两种:若成功(找到了增广轨),则该点增广完成,进入下一个点的增广。若失败(没有找到增广轨),则需要改变一些点的标号,使得图中可行边的数量增加。方法为:将所有在增广轨中(就是在增广过程中遍历到)的X方点的标号全部减去一个常数d,所有在增广轨中的Y方点的标号全部加上一个常数d,则对于图中的任意一条边(i, j, W)(i为X方点,j为Y方点):
<1>i和j都在增广轨中:此时边(i, j)的(lx[i]+ly[j])值不变,也就是这条边的可行性不变(原来是可行边则现在仍是,原来不是则现在仍不是);
<2>i在增广轨中而j不在:此时边(i, j)的(lx[i]+ly[j])的值减少了d,也就是原来这条边不是可行边(否则j就会被遍历到了),而现在可能是;
<3>j在增广轨中而i不在:此时边(i, j)的(lx[i]+ly[j])的值增加了d,也就是原来这条边不是可行边(若这条边是可行边,则在遍历到j时会紧接着执行DFS(i),此时i就会被遍历到),现在仍不是;
<4>i和j都不在增广轨中:此时边(i, j)的(lx[i]+ly[j])值不变,也就是这条边的可行性不变。
这样,在进行了这一步修改操作后,图中原来的可行边仍可行,而原来不可行的边现在则可能变为可行边。那么d的值应取多少?显然,整个点标不能失去可行性,也就是对于上述的第<2>类边,其lx[i]+ly[j]>=W这一性质不能被改变,故取所有第<2>类边的(lx[i]+ly[j]-W)的最小值作为d值即可。这样一方面可以保证点标的可行性,另一方面,经过这一步后,图中至少会增加一条可行边。
(5)修改后,继续对这个X方点DFS增广,若还失败则继续修改,直到成功为止;
以上就是KM算法的基本思路。但是朴素的实现方法,时间复杂度为O(n4)——需要找O(n)次增广路,每次增广最多需要修改O(n)次顶标,每次修改顶标时由于要枚举边来求d值,复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3)的。我们给每个Y顶点一个“松弛量”函数slack,每次开始找增广路时初始化为无穷大。在寻找增广路的过程中,检查边(i,j)时,如果它不在相等子图中,则让slack[j]变成原值与lx[i]+ly[j]-w[i,j]的较小值。这样,在修改顶标时,取所有不在交错树中的Y顶点的slack值中的最小值作为d值即可。但还要注意一点:修改顶标后,要把所有的slack值都减去d。
模板:
#include <stdio.h> #include <string.h> #include <iostream> #define maxn 310 #define inf 100000000 using namespace std; int nx, ny; int link[maxn], lx[maxn], ly[maxn], slack[maxn]; //lx,ly为顶标,nx,ny分别为x点集y点集的个数 int visx[maxn], visy[maxn], w[maxn][maxn]; int dfs(int x) { visx[x] = 1; for (int y=1; y<=ny; ++y) { if (visy[y]) continue; int tmp = lx[x] + ly[y] - w[x][y]; if (tmp == 0) { visy[y] = 1; if (link[y] == -1 || dfs(link[y])) { link[y] = x; return 1; } } else if (slack[y] > tmp) { // 不在相等子图中slack取最小的 slack[y] = tmp; } } return 0; } int km() { int i, j; memset(link, -1, sizeof(link)); memset(ly, 0, sizeof(ly)); for (int i=1; i<=nx; ++i) { // lx初始化为左右相连边权值最大值 lx[i] = -inf; for (int j=1; j<=ny; ++j) { if (w[i][j] > lx[i]) lx[i] = w[i][j]; } } for (int x=1; x<=nx; ++x) { for (int i=1; i<=ny; ++i) slack[i] = inf; while(1) { //cout << "===\n"; memset(visx, 0, sizeof(visx)); memset(visy, 0, sizeof(visy)); if (dfs(x)) break; // 该点找到增广路 完成增广 进入下一个点的增广 //若失败(没有找到增广轨),则需要改变一些点的标号,使得图中可行边的数量增加。 //方法为:将所有在增广轨中(就是在增广过程中遍历到)的X方点的标号全部减去一个常数d, //所有在增广轨中的Y方点的标号全部加上一个常数d int d = inf; // 找d for (int i=1; i<=ny; ++i) { if (!visy[i] && d>slack[i]) d = slack[i]; } for (int i=1; i<=nx; ++i) { if (visx[i]) lx[i] -= d; } for (int i=1; i<=ny; ++i) { if (visy[i]) ly[i] += d; else slack[i] -= d; } } } int res = 0; for (int i=1; i<=ny; ++i) { if (link[i] != -1) { res += w[link[i]][i]; } } return res; }
注意以下几点;
1,匹配两边节点不需要相等;
2,求最小权的时候只需要将权值取负,在求最大权即可;//十分有效
3,不存在的边权初始化为负无穷大;
自己又写了一遍,很多地方重新理解了一下。
#include <stdio.h> #include <string.h> #include <iostream> #define siz 310 #define inf 100000000 using namespace std; int lx[siz], ly[siz]; int slack[siz]; int visx[siz], visy[siz]; int mp[siz][siz]; int link[siz]; int n, nx, ny; bool dfs(int x) { visx[x] = 1; // 左集合访问到的点一定都在交错树中------------- for (int i=1; i<=ny; ++i) { if (visy[i]) continue; int w = lx[x] + ly[i] - mp[x][i]; if (w == 0) { visy[i] = 1; // 右集合的点在相等子图中 就一定在交错树中------------ if (link[i] == -1 || dfs(link[i])) { link[i] = x; return 1; } } else slack[i] = min(slack[i], w); // 修改不在相等子图中的点 的slack值 } return 0; } int km() { memset(link, -1, sizeof(link)); // lx 和 ly的初始化 memset(ly, 0, sizeof(ly)); for (int i=1; i<=nx; ++i) { lx[i] = -inf; for (int j=1; j<=ny; ++j) { lx[i] = max(lx[i], mp[i][j]); } } // 从x集合的每个点寻找增广路 for (int x=1; x<=nx; ++x) { for (int i=1; i<=ny; ++i) { //slack 的初始化对当前点寻找增广路的左右过程中有效----------- slack[i] = inf; } while(1) { memset(visx, 0, sizeof(visx)); //每次寻找增广路之前初始化---------- memset(visy, 0, sizeof(visy)); if (dfs(x)) break; //该点增广完成 // 否则修改可行顶标 int d = inf; for (int i=1; i<=ny; ++i) { if (!visy[i]) d = min(d, slack[i]); } for (int i=1; i<=nx; ++i) { if (visx[i]) lx[i] -= d; } for (int i=1; i<=ny; ++i) { if (visy[i]) ly[i] += d; else slack[i] -= d; } } } int res = 0; for (int i=1; i<=ny; ++i) { //必定已经找到一个所有相等子图的点导出的完美匹配--------- if (link[i] != -1) res += mp[link[i]][i]; // 右集合i的匹配点link[i] 这里不像无向图那样,需要注意顺序--------- } return res; }
推荐:
http://www.cppblog.com/MatoNo1/archive/2012/04/26/151724.html