KM算法
两个不错的介绍KM算法的文章:
1:
http://www.cppblog.com/MatoNo1/archive/2011/07/23/151724.aspx
2:
KM算法是通过给每个顶点一个标号(叫做顶标)来把求最大权匹配的问题转化为求完备匹配的问题的。设顶点Xi的顶标为A[i],顶点Yi的顶标为B[i],顶点Xi与Yj之间的边权为w[i,j]。在算法执行过程中的任一时刻,对于任一条边(i,j),A[i]+B[j]>=w[i,j]始终成立。KM算法的正确性基于以下定理:
若由二分图中所有满足A[i]+B[j]=w[i,j]的边(i,j)构成的子图(称做相等子图)有完备匹配,那么这个完备匹配就是二分图的最大权匹配。
这个定理是显然的。因为对于二分图的任意一个匹配,如果它包含于相等子图,那么它的边权和等于所有顶点的顶标和;如果它有的边不包含于相等子图,那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。
初始时为了使A[i]+B[j]>=w[i,j]恒成立,令A[i]为所有与顶点Xi关联的边的最大权,B[j]=0。如果当前的相等子图没有完备匹配,就按下面的方法修改顶标以使扩大相等子图,直到相等子图具有完备匹配为止。
我们求当前相等子图的完备匹配失败了,是因为对于某个X顶点,我们找不到一条从它出发的交错路。这时我们获得了一棵交错树,它的叶子结点全部是X顶点。现在我们把交错树中X顶点的顶标全都减小某个值d,Y顶点的顶标全都增加同一个值d,那么我们会发现:
- 两端都在交错树中的边(i,j),A[i]+B[j]的值没有变化。也就是说,它原来属于相等子图,现在仍属于相等子图。
- 两端都不在交错树中的边(i,j),A[i]和B[j]都没有变化。也就是说,它原来属于(或不属于)相等子图,现在仍属于(或不属于)相等子图。
- X端不在交错树中,Y端在交错树中的边(i,j),它的A[i]+B[j]的值有所增大。它原来不属于相等子图,现在仍不属于相等子图。
- X端在交错树中,Y端不在交错树中的边(i,j),它的A[i]+B[j]的值有所减小。也就说,它原来不属于相等子图,现在可能进入了相等子图,因而使相等子图得到了扩大。
现在的问题就是求d值了。为了使A[i]+B[j]>=w[i,j]始终成立,且至少有一条边进入相等子图,d应该等于min{A[i]+B[j]-w[i,j]|Xi在交错树中,Yi不在交错树中}。
以上就是KM算法的基本思路。但是朴素的实现方法,时间复杂度为O(n4)——需要找O(n)次增广路,每次增广最多需要修改O(n)次顶标,每次修改顶标时由于要枚举边来求d值,复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3) 的。我们给每个Y顶点一个“松弛量”函数slack,每次开始找增广路时初始化为无穷大。在寻找增广路的过程中,检查边(i,j)时,如果它不在相等子图 中,则让slack[j]变成原值与A[i]+B[j]-w[i,j]的较小值。这样,在修改顶标时,取所有不在交错树中的Y顶点的slack值中的最小 值作为d值即可。但还要注意一点:修改顶标后,要把所有的slack值都减去d。
模板对应http://acm.hdu.edu.cn/showproblem.php?pid=2255
O(N^4)模板:
#include <cstdio> #include <cstring> #include <iostream> #define maxn 301 using namespace std; const int inf = 99999999; int w[maxn][maxn],link[maxn]; int lx[maxn],ly[maxn];//记录顶标 bool vtx[maxn],vty[maxn];//记录X,Y点集是否被访问过 int nx,ny; bool dfs(int i) { int j; vtx[i] = true;//记住要标记 for (j = 0; j < ny; ++j) { //按可行边超找增广轨 if (!vty[j] && lx[i] + ly[j] == w[i][j]) { vty[j] = true; if (link[j] == -1 || dfs(link[j])) { link[j] = i; return true; } } } return false; } int KM() { int i,j,k; //初始化X点集的顶标 for (i = 0; i < nx; ++i) { for (j = 0,lx[i] = -inf; j < ny; ++j) { lx[i] = max(lx[i],w[i][j]); } } //初始化 for (i = 0; i < maxn; ++i) { link[i] = -1; ly[i] = 0; } for (i = 0; i < nx; ++i) { while (1) { for (j = 0; j < maxn; ++j) vtx[j] = vty[j] = false; if (dfs(i)) break;//找到增广轨跳出循环 int d = inf; //寻找d for (j = 0; j < nx; ++j) { if (vtx[j]) { for (k = 0; k < ny; ++k) { if (!vty[k]) d = min(d,lx[j] + ly[k] - w[j][k]); } } } if (d == inf) return -1;//无完备匹配退出
//在经过dfs后得到的交错树上进行加减d,因为在交错树上的都满足lx[i] + ly[j] == w[i][j]加减后无影响。 for (j = 0; j < nx; ++j) if (vtx[j]) lx[j] -= d; for (j = 0; j < ny; ++j) if (vty[j]) ly[j] += d; } } //计算最大带权匹配 int sum = 0; for (i = 0; i < ny; ++i) if (link[i] > -1) sum += w[link[i]][i]; return sum; } int main() { int i,j; while (~scanf("%d",&nx)) { ny = nx; memset(w,0,sizeof(w)); for (i = 0; i < nx; ++i) { for (j = 0; j < ny; ++j) { scanf("%d",&w[i][j]); } } printf("%d\n",KM()); } return 0; }
O(n^3)模板:
#include <cstdio> #include <cstring> #include <iostream> #define maxn 301 using namespace std; const int inf = 99999999; int w[maxn][maxn],link[maxn]; int lx[maxn],ly[maxn];//记录顶标 int slack[maxn]; bool vtx[maxn],vty[maxn];//记录X,Y点集是否被访问过 int nx,ny; bool dfs(int i) { int j; vtx[i] = true; for (j = 0; j < ny; ++j) { if (vty[j]) continue; int tmp = lx[i] + ly[j] - w[i][j]; if (tmp == 0) { vty[j] = true; if (link[j] == -1 || dfs(link[j])) { link[j] = i; return true; } } else slack[j] = min(slack[j],tmp);//更新松弛量 } return false; } int KM() { int i,j; //初始化lx for (i = 0; i < nx; ++i) { for (j = 0,lx[i] = -inf; j < ny; ++j) { lx[i] = min(lx[i],w[i][j]); } } for (i = 0; i < maxn; ++i) { link[i] = -1; ly[i] = 0; } for (i = 0; i < nx; ++i) { for (j = 0; j < ny; ++j) slack[j] = inf;//初始化松弛量 while (1) { for (j = 0; j < maxn; ++j) vtx[j] = vty[j] = false; if (dfs(i)) break; int d = inf; for (j = 0; j < ny; ++j) { if (!vty[j] && d > slack[j]) d = slack[j]; } if (d == inf) return -1; for (j = 0; j < nx; ++j) if (vtx[j]) lx[j] -= d; for (j = 0; j < ny; ++j) if (vty[j]) ly[j] += d; else slack[j] -= d;//注意松弛量的修改 } } int sum = 0; for (i = 0; i < ny; ++i) if (link[i] > -1) sum += w[link[i]][i]; return sum; } int main() { int i,j; while (~scanf("%d",&nx)) { ny = nx; memset(w,0,sizeof(w)); for (i = 0; i < nx; ++i) { for (j = 0; j < ny; ++j) { scanf("%d",&w[i][j]); } } printf("%d\n",KM()); } return 0; }