二分图最大权匹配 km算法

这个算法的本质还是不断的找增广路；

KM算法的正确性基于以下定理：
若由二分图中所有满足A[i]+B[j]=w[i,j]的边(i,j)构成的子图（称做相等子图）有完备匹配，那么这个完备匹配就是二分图的最大权匹配。

这个定理是显然的。因为对于二分图的任意一个匹配，如果它包含于相等子图，那么它的边权和等于所有顶点的顶标和；如果它有的边不包含于相等子图，那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。

（1）可行点标：每个点有一个标号，记lx[i]为X方点i的标号，ly[j]为Y方点j的标号。如果对于图中的任意边(i, j, W)都有lx[i]+ly[j]>=W，则这一组点标是可行的。特别地，对于lx[i]+ly[j]=W的边(i, j, W)，称为可行边；

（2）KM算法的核心思想就是通过修改某些点的标号（但要满足点标始终是可行的），不断增加图中的可行边总数，直到图中存在仅由可行边组成的完全匹配为止，此时这个匹配一定是最佳的（因为由可行点标的的定义，图中的任意一个完全匹配，其边权总和均不大于所有点的标号之和，而仅由可行边组成的完全匹配的边权总和等于所有点的标号之和，故这个匹配是最佳的）。一开始，求出每个点的初始标号：lx[i]=max{e.W|e.x=i}（即每个X方点的初始标号为与这个X方点相关联的权值最大的边的权值），ly[j]=0（即每个Y方点的初始标号为0）。这个初始点标显然是可行的，并且，与任意一个X方点关联的边中至少有一条可行边；

（3）然后，从每个X方点开始DFS增广。DFS增广的过程与最大匹配的Hungary算法基本相同，只是要注意两点：一是只找可行边，二是要把搜索过程中遍历到的X方点全部记下来（可以用vst搞一下），以进行后面的修改；

（4）增广的结果有两种：若成功（找到了增广轨），则该点增广完成，进入下一个点的增广。若失败（没有找到增广轨），则需要改变一些点的标号，使得图中可行边的数量增加。方法为：将所有在增广轨中（就是在增广过程中遍历到）的X方点的标号全部减去一个常数d，所有在增广轨中的Y方点的标号全部加上一个常数d，则对于图中的任意一条边(i, j, W)（i为X方点，j为Y方点）：

<1>i和j都在增广轨中：此时边(i, j)的(lx[i]+ly[j])值不变，也就是这条边的可行性不变（原来是可行边则现在仍是，原来不是则现在仍不是）；
<2>i在增广轨中而j不在：此时边(i, j)的(lx[i]+ly[j])的值减少了d，也就是原来这条边不是可行边（否则j就会被遍历到了），而现在可能是；
<3>j在增广轨中而i不在：此时边(i, j)的(lx[i]+ly[j])的值增加了d，也就是原来这条边不是可行边（若这条边是可行边，则在遍历到j时会紧接着执行DFS(i)，此时i就会被遍历到），现在仍不是；
<4>i和j都不在增广轨中：此时边(i, j)的(lx[i]+ly[j])值不变，也就是这条边的可行性不变。
这样，在进行了这一步修改操作后，图中原来的可行边仍可行，而原来不可行的边现在则可能变为可行边。那么d的值应取多少？显然，整个点标不能失去可行性，也就是对于上述的第<2>类边，其lx[i]+ly[j]>=W这一性质不能被改变，故取所有第<2>类边的(lx[i]+ly[j]-W)的最小值作为d值即可。这样一方面可以保证点标的可行性，另一方面，经过这一步后，图中至少会增加一条可行边。

（5）修改后，继续对这个X方点DFS增广，若还失败则继续修改，直到成功为止；

以上就是KM算法的基本思路。但是朴素的实现方法，时间复杂度为O(n4)——需要找O(n)次增广路，每次增广最多需要修改O(n)次顶标，每次修改顶标时由于要枚举边来求d值，复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3)的。我们给每个Y顶点一个“松弛量”函数slack，每次开始找增广路时初始化为无穷大。在寻找增广路的过程中，检查边(i,j)时，如果它不在相等子图中，则让slack[j]变成原值与lx[i]+ly[j]-w[i,j]的较小值。这样，在修改顶标时，取所有不在交错树中的Y顶点的slack值中的最小值作为d值即可。但还要注意一点：修改顶标后，要把所有的slack值都减去d。

模板：

#include <stdio.h>
#include <string.h>
#include <iostream>
#define maxn 310
#define inf 100000000
using namespace std;

int nx, ny;
int link[maxn], lx[maxn], ly[maxn], slack[maxn]; //lx,ly为顶标，nx,ny分别为x点集y点集的个数
int visx[maxn], visy[maxn], w[maxn][maxn];

int dfs(int x) {
    visx[x] = 1;
    for (int y=1; y<=ny; ++y) {
        if (visy[y])
            continue;
        int tmp = lx[x] + ly[y] - w[x][y];
        if (tmp == 0) {
            visy[y] = 1;
            if (link[y] == -1 || dfs(link[y])) {
                link[y] = x;
                return 1;
            }
        }
        else if (slack[y] > tmp) { // 不在相等子图中slack取最小的
            slack[y] = tmp;
        }
    }
    return 0;
}

int km() {
    int i, j;
    memset(link, -1, sizeof(link));
    memset(ly, 0, sizeof(ly));

    for (int i=1; i<=nx; ++i) { // lx初始化为左右相连边权值最大值
        lx[i] = -inf;
        for (int j=1; j<=ny; ++j) {
            if (w[i][j] > lx[i])
                lx[i] = w[i][j];
        }
    }

    for (int x=1; x<=nx; ++x) {
        for (int i=1; i<=ny; ++i)
            slack[i] = inf;
        while(1) {
            //cout << "===\n";
            memset(visx, 0, sizeof(visx));
            memset(visy, 0, sizeof(visy));

            if (dfs(x)) break; // 该点找到增广路 完成增广 进入下一个点的增广
                                //若失败（没有找到增广轨），则需要改变一些点的标号，使得图中可行边的数量增加。
                                //方法为：将所有在增广轨中（就是在增广过程中遍历到）的X方点的标号全部减去一个常数d，
                                //所有在增广轨中的Y方点的标号全部加上一个常数d

            int d = inf; // 找d
            for (int i=1; i<=ny; ++i) {
                if (!visy[i] && d>slack[i])
                    d = slack[i];
            }

            for (int i=1; i<=nx; ++i) {
                if (visx[i])
                    lx[i] -= d;
            }
            for (int i=1; i<=ny; ++i) {
                if (visy[i])
                    ly[i] += d;
                else slack[i] -= d;
            }
        }
    }
    int res = 0;
    for (int i=1; i<=ny; ++i) {
        if (link[i] != -1) {
            res += w[link[i]][i];
        }
    }
    return res;
}

注意以下几点;

1，匹配两边节点不需要相等；

2，求最小权的时候只需要将权值取负，在求最大权即可；//十分有效

3，不存在的边权初始化为负无穷大；

自己又写了一遍，很多地方重新理解了一下。

#include <stdio.h>
#include <string.h>
#include <iostream>
#define siz 310
#define inf 100000000
using namespace std;

int lx[siz], ly[siz];
int slack[siz];
int visx[siz], visy[siz];
int mp[siz][siz];
int link[siz];
int n, nx, ny;

bool dfs(int x) {
    visx[x] = 1;  // 左集合访问到的点一定都在交错树中-------------
    for (int i=1; i<=ny; ++i) {
        if (visy[i]) continue;
        int w = lx[x] + ly[i] - mp[x][i];
        if (w == 0) {
            visy[i] = 1;  // 右集合的点在相等子图中 就一定在交错树中------------
            if (link[i] == -1 || dfs(link[i])) {
                link[i] = x;
                return 1;
            }
        }
        else slack[i] = min(slack[i], w); // 修改不在相等子图中的点 的slack值
    }
    return 0;
}

int km() {
    memset(link, -1, sizeof(link));
    // lx 和 ly的初始化
    memset(ly, 0, sizeof(ly));
    for (int i=1; i<=nx; ++i) {
        lx[i] = -inf;
        for (int j=1; j<=ny; ++j) {
            lx[i] = max(lx[i], mp[i][j]);
        }
    }

    // 从x集合的每个点寻找增广路
    for (int x=1; x<=nx; ++x) {
        for (int i=1; i<=ny; ++i) { //slack 的初始化对当前点寻找增广路的左右过程中有效-----------
            slack[i] = inf;
        }
        while(1) {
            memset(visx, 0, sizeof(visx));  //每次寻找增广路之前初始化----------
            memset(visy, 0, sizeof(visy));
            if (dfs(x)) break; //该点增广完成
            // 否则修改可行顶标
            int d = inf;
            for (int i=1; i<=ny; ++i) {
                if (!visy[i])
                d = min(d, slack[i]);
            }

            for (int i=1; i<=nx; ++i) {
                if (visx[i]) lx[i] -= d;
            }
            for (int i=1; i<=ny; ++i) {
                if (visy[i]) ly[i] += d;
                else slack[i] -= d;
            }
        }
    }

    int res = 0;
    for (int i=1; i<=ny; ++i) { //必定已经找到一个所有相等子图的点导出的完美匹配---------
        if (link[i] != -1)
        res += mp[link[i]][i]; // 右集合i的匹配点link[i] 这里不像无向图那样，需要注意顺序---------
    }
    return res;
}

二分图 最大权匹配 km算法

公告

二分图最大权匹配 km算法