(转)二分图的最佳匹配(KM算法)
最近在学习二分匹配,二分图的简单匹配并不是很难的,但是对于最佳匹配则是一直搞不懂,查找了很久的资料,发现大部分都是差不多的,对于KM算法的介绍基本是一样的,看的是迷迷糊糊的,不是很理解那些,找了很久,终于找到了一份资料,感觉比较容易理解,现转载分享,并作备忘,感谢这位大牛!
本文转自:http://blog.csdn.net/Rappy/archive/2007/09/19/1790647.aspx
找了标程研究了一下,修改成自己的风格了,贴上来。
引用:
KM算法是通过给每个顶点一个标号(叫做顶标)来把求最大权匹配的问题转化为求完备匹配的问题的。设顶点Xi的顶标为A[i],顶点Yi的顶标为B [i],顶点Xi与Yj之间的边权为w[i,j]。在算法执行过程中的任一时刻,对于任一条边(i,j),A[i]+B[j]>=w[i,j]始终 成立。KM算法的正确性基于以下定理:
若由二分图中所有满足A[i]+B[j]=w[i,j]的边(i,j)构成的子图(称做相等子图)有完备匹配,那么这个完备匹配就是二分图的最大权匹配。
这个定理是显然的。因为对于二分图的任意一个匹配,如果它包含于相等子图,那么它的边权和等于所有顶点的顶标和;如果它有的边不包含于相等子图,那么它的边权和小于所有顶点的顶标和。所以相等子图的完备匹配一定是二分图的最大权匹配。
初始时为了使A[i]+B[j]>=w[i,j]恒成立,令A[i]为所有与顶点Xi关联的边的最大权,B[j]=0。如果当前的相等子图没有完备匹配,就按下面的方法修改顶标以使扩大相等子图,直到相等子图具有完备匹配为止。
我们求当前相等子图的完备匹配失败了,是因为对于某个X顶点,我们找不到一条从它出发的交错路。这时我们获得了一棵交错树,它的叶子结点全部是X顶点。现在我们把交错树中X顶点的顶标全都减小某个值d,Y顶点的顶标全都增加同一个值d,那么我们会发现:
两端都在交错树中的边(i,j),A[i]+B[j]的值没有变化。也就是说,它原来属于相等子图,现在仍属于相等子图。
两端都不在交错树中的边(i,j),A[i]和B[j]都没有变化。也就是说,它原来属于(或不属于)相等子图,现在仍属于(或不属于)相等子图。
X端不在交错树中,Y端在交错树中的边(i,j),它的A[i]+B[j]的值有所增大。它原来不属于相等子图,现在仍不属于相等子图。
X端在交错树中,Y端不在交错树中的边(i,j),它的A[i]+B[j]的值有所减小。也就说,它原来不属于相等子图,现在可能进入了相等子图,因而使相等子图得到了扩大。
现在的问题就是求d值了。为了使A[i]+B[j]>=w[i,j]始终成立,且至少有一条边进入相等子图,d应该等于min{A[i]+B[j]-w[i,j]|Xi在交错树中,Yi不在交错树中}。
以上就是KM算法的基本思路。但是朴素的实现方法,时间复杂度为O(n4)——需要找O(n)次增广路,每次增广最多需要修改O(n)次顶 标,每次修改顶标时由于要枚举边来求d值,复杂度为O(n2)。实际上KM算法的复杂度是可以做到O(n3)的。我们给每个Y顶点一个“松弛量”函数 slack,每次开始找增广路时初始化为无穷大。在寻找增广路的过程中,检查边(i,j)时,如果它不在相等子图中,则让slack[j]变成原值与A [i]+B[j]-w[i,j]的较小值。这样,在修改顶标时,取所有不在交错树中的Y顶点的slack值中的最小值作为d值即可。但还要注意一点:修改 顶标后,要把所有的slack值都减去d。
1 #include <cstdio>
2 #include <memory.h>
3 #include <algorithm> // 使用其中的 min 函数
4 using namespace std;
5
6 const int MAX = 1024;
7
8 int n; // X 的大小
9 int weight [MAX] [MAX]; // X 到 Y 的映射(权重)
10 int lx [MAX], ly [MAX]; // 标号
11 bool sx [MAX], sy [MAX]; // 是否被搜索过
12 int match [MAX]; // Y(i) 与 X(match [i]) 匹配
13
14 // 初始化权重
15 void init (int size);
16 // 从 X(u) 寻找增广道路,找到则返回 true
17 bool path (int u);
18 // 参数 maxsum 为 true ,返回最大权匹配,否则最小权匹配
19 int bestmatch (bool maxsum = true);
20
21 void init (int size)
22 {
23 // 根据实际情况,添加代码以初始化
24 n = size;
25 for (int i = 0; i < n; i ++)
26 for (int j = 0; j < n; j ++)
27 scanf ("%d", &weight [i] [j]);
28 }
29
30
31 bool path (int u)
32 {
33 sx [u] = true;
34 for (int v = 0; v < n; v ++)
35 if (!sy [v] && lx[u] + ly [v] == weight [u] [v])
36 {
37 sy [v] = true;
38 if (match [v] == -1 || path (match [v]))
39 {
40 match [v] = u;
41 return true;
42 }
43 }
44 return false;
45 }
46
47 int bestmatch (bool maxsum)
48 {
49 int i, j;
50 if (!maxsum)
51 {
52 for (i = 0; i < n; i ++)
53 for (j = 0; j < n; j ++)
54 weight [i] [j] = -weight [i] [j];
55 }
56
57 // 初始化标号
58 for (i = 0; i < n; i ++)
59 {
60 lx [i] = -0x1FFFFFFF;
61 ly [i] = 0;
62 for (j = 0; j < n; j ++)
63 if (lx [i] < weight [i] [j])
64 lx [i] = weight [i] [j];
65 }
66
67 memset (match, -1, sizeof (match));
68 for (int u = 0; u < n; u ++)
69 while (1)
70 {
71 memset (sx, 0, sizeof (sx));
72 memset (sy, 0, sizeof (sy));
73 if (path (u))
74 break;
75
76 // 修改标号
77 int dx = 0x7FFFFFFF;
78 for (i = 0; i < n; i ++)
79 if (sx [i])
80 for (j = 0; j < n; j ++)
81 if(!sy [j])
82 dx = min (lx[i] + ly [j] - weight [i] [j], dx);
83 for (i = 0; i < n; i ++)
84 {
85 if (sx [i])
86 lx [i] -= dx;
87 if (sy [i])
88 ly [i] += dx;
89 }
90 }
91
92 int sum = 0;
93 for (i = 0; i < n; i ++)
94 sum += weight [match [i]] [i];
95
96 if (!maxsum)
97 {
98 sum = -sum;
99 for (i = 0; i < n; i ++)
100 for (j = 0; j < n; j ++)
101 weight [i] [j] = -weight [i] [j]; // 如果需要保持 weight [ ] [ ] 原来的值,这里需要将其还原
102 }
103 return sum;
104 }
105
106
107 int main()
108 {
109 int n;
110 scanf ("%d", &n);
111 init (n);
112 int cost = bestmatch (true);
113
114 printf ("%d ", cost);
115 for (int i = 0; i < n; i ++)
116 {
117 printf ("Y %d -> X %d ", i, match [i]);
118 }
119
120 return 0;
121 }
122
/*
5
3 4 6 4 9
6 4 5 3 8
7 5 3 4 2
6 3 2 2 5
8 4 5 4 7
//执行bestmatch (true) ,结果为 29
*/
/*
5
7 6 4 6 1
4 6 5 7 2
3 5 7 6 8
4 7 8 8 5
2 6 5 6 3
//执行 bestmatch (false) ,结果为 21
*/
这个实现和图论书上描述的有所不同,这个和匈牙利算法方法上是一样的(不断地寻找增广道路。。),而不是像书上在过程中调用匈牙利算法。。