图的匹配算法及其相关
图的匹配算法及其相关
本文大量参考了:
- 国家集训队2015论文集,陈胤伯,浅谈图的匹配算法及其应用
- 国家集训队2017论文集,杨家齐,基于线性代数的一般图匹配
- Fuyuki 的博客,题解 P6113 【模板】一般图最大匹配
匹配和增广路
对于任意图 \(G=(V,E)\),一组两两没有公共交点的边集 \(M\)(\(M\subseteq E\))称为这张图的一个匹配。
把在匹配中的点称为匹配点,把不在匹配中的点称为未盖点。所有点都是匹配点的匹配被称作完美匹配。
设 \(P\) 为图中一条简单路径,满足其两个端点都是未盖点,且 \(P\) 中的边为非匹配边、匹配边交替出现(满足这种条件的路径我们也称为交替路),则称 \(P\) 为一条增广路。
-
定理 1:一个匹配 \(M\) 是图 \(G\) 的最大匹配当且仅当 \(G\) 中不存在增广路。
证明:必要性显然,考虑充分性。
考虑 \(M\) 和一个存在的更大的匹配 \(M'\) 的对称差 \(D=M\oplus M'=(M\cup M')-(M\cap M')\)。
容易知道 \(D\) 中来自 \(M'\) 的元素个数仍然大于来自 \(M\) 的元素个数。
\(D\) 中每个点度数至多为 \(2\),且度数为 \(2\) 的点两条邻边分别来自 \(M\) 和 \(M'\)。这说明 \(D\) 肯定由若干简单环和链组成,且在环和链中来自 \(M\) 和 \(M'\) 的边肯定交替出现,由此可知 \(D\) 中的环都是简单偶环。
注意对称差中 “交替” 的含义和原图中 “交替” 的含义不同,对称差中指的是来自 \(M\) 和 \(M'\) 的边交替出现,原图中指的是匹配边和非匹配边交替出现。
考虑去掉那些简单环,剩下的图中肯定仍然有来自 \(M'\) 的边的数量大于来自 \(M\) 的边的数量。
于是肯定存在一条两端的边都来自 \(M'\) 的链,这对于 \(M\) 来说是一条增广路,于是充分性得证。
由定理 1 的证明可以看出:设 \(M,M'\) 是两个不同的最大匹配,设 \(D\) 为它们的对称差,\(D\) 仍然由若干偶环和若干链(此时一定为偶链)组成。这说明任意两个最大匹配,都可以通过对一个中的若干不相交偶环、偶链取反得到另一个。特别地,两个完美匹配的对称差只有偶环,否则如果有偶链肯定存在未盖点。
从定理 1,我们可以得到一个求最大匹配的算法:每次遍历所有未盖点找增广路并增广,直到找不到为止。(注意增广一次最大匹配一定会增大 \(1\),所以算法的时间复杂度是有限的)
-
引理 1:如果某一次找不到从未盖点 \(x\) 出发的增广路,那么无论如何再增广也依然找不到从未盖点 \(x\) 出发的增广路。
证明:考虑某一次对于增广路 \(a - b\) 增广后,出现了以 \(x\) 为端点的增广路 \(P_x\),则 \(P_x\) 一定和 \(a-b\) 有交,而由于增广前 \(a-b\) 是交错路(交点在 \(a-b\) 上的两条邻边必然有一条与在 \(P_x\) 上的那条邻边匹配性互异)且 \(a,b,x\) 均为未盖点,所以增广前 \(x\) 就已经能够走到 \(a,b\) 中的某个点形成增广路了,矛盾。
另一方面,注意到增广一次实际上是对匹配点点集的扩充,即一个点如果已经是匹配点了那么之后也一定一直会是匹配点,所以我们可以对算法进一步优化:枚举每个未盖点,各找一次从它出发的增广路并增广(注意到增广一次后这个点就不可再增广了,所以只用找一次)。
有关二分图匹配
匈牙利算法
考虑把我们上一节所述的算法放到二分图中。当增广路的起点固定后,我们可以给每条边定向,然后把 “存在到未盖点 \(y\) 的增广路” 转化为 “沿着边的方向存在一条简单路径到达 \(y\)”。于是可以通过 dfs 找增广路。
每次找增广路的时间复杂度是 \(O(m)\) 的,于是总时间复杂度为 \(O(nm)\)。
事实上,我们可以将复杂度降至 \(O(\text{匹配数}\times m)\):每次 dfs 若没有找到增广路,那么我们就不清空 vis 数组,因为从该次增广的起点 \(s\) 出发不能走到任何未盖点,那么从 \(s\) 能到达的任何点出发都不可能走到未盖点,于是在边的方向不变的情况下(未进行新的增广的情况下),已经遍历过的点就不用再遍历一次了。
二分图最大匹配关键点
关键点指的是一定在最大匹配中的点。
对于单个点,一种判定方法是先求出原图的最大匹配,然后再把这个点去掉求最大匹配,然后看最大匹配有没有变化。
另一种求出每一个关键点的方法:
先求任意一个最大匹配 \(M\),那么关键点至少是现在图上的匹配点。考虑 \(M\) 中的一个匹配点 \(p\),设 \(M'\) 为某个不包含 \(p\) 的最大匹配,那么在它们的对称差 \(D\) 中一定存在一条以 \(p\) 为端点的偶交替链,这一条链的另一端在 \(M'\) 中而不在 \(M\) 中,那么在原图中也一定存在一条以 \(p\) 为端点从匹配边出发的偶交替链,使得终点是某个未盖点 \(t\)。
而且发现如果我们在原图中找到了这么一条偶交替链,那么我们可以通过将这条链取反的方式使得 \(p\) 不在匹配中。于是有:
- 引理 2:一个匹配点 \(p\) 不是关键点,当且仅当存在一条以 \(p\) 为端点从匹配边出发的交替链,使得终点为某个未盖点 \(t\)(那么显然链长肯定为偶数)。
由于链长为偶数,所以 \(p,t\) 同侧,于是我们可以从左边每一个未盖点出发走交替链并给能到达的点打上标记,那么左侧没有标记的匹配点就是关键点。右边同理。分左右两侧处理的原因是 dfs 时我们可以通过当前点在左右哪一侧来判断下一条边是走匹配边还是非匹配边(相当于给每一条边定了个向),方便了记忆化,时间复杂度为 \(O(n+m)\)。
二分图最小点覆盖
最大匹配 = 最小点覆盖
证明:
对于一个二分图,假设我们已经求出了它的最大匹配。
首先由于最大匹配中已经有了这么多条顶点互不相交的边了,所以最小点覆盖至少为最大匹配。
我们来通过构造证明它可以达到这个下界。
从左边每一个未匹配点出发走增广路(未匹配边、匹配边、……、未匹配边、匹配边),并给经过的点打上可达标记,接下来证明这组点集就是一组合法的最小点覆盖:左边所有不可达点+右边所有可达点。
先证明这是一组点覆盖,考虑所有的边 \((u,v)\):(\(u\) 在左边,\(v\) 在右边)
- 若 \((u,v)\) 为非匹配边,则若 \(u\) 可达,则 \(v\) 也可达。
- 若 \((u,v)\) 为匹配边,则 \(u,v\) 可达状态是捆绑的,因为若可达 \(v\) 则可达 \(u\),且不可能不通过 \(v\) 到达 \(u\)(可以注意到除了起点外,增广路上任何一个左侧点都是由其匹配边所对应的右侧点到达的)
所以不存在 \(u\) 可达、\(v\) 不可达的边,所以我们只需要取出左边的不可达点和右边的可达点即可覆盖所有的边。
接下来还需说明这组点覆盖的大小恰为最大匹配:
注意到左边不可达点一定是匹配点(因为我们从左边所有非匹配点都开始走了一遍),且右边可达点也一定是匹配点(否则存在增广路),而由上面边 \((u,v)\) 为匹配边时 \(u,v\) 可达状态捆绑可知一条匹配边只有恰好一个点在点覆盖内,所以这组点覆盖的大小恰为最大匹配。
另一种证明方式:二分图上最大流(最大匹配)= 最小割(最小点覆盖)。
二分图最大独立集
最大独立集 = n - 最小点覆盖 = n - 最大匹配
证明:
把最大独立集看作是:在原图上每次删掉一个点及其相连的边,求删去最少的点使得原图所有边都被删完。于是最大独立集即为最小点覆盖的补集。
二分图最小边覆盖
最小边覆盖 = n - 最大匹配
证明:
只会构造方式:先贪心地选一组最大匹配,然后剩下的未匹配点各自选一条出边。总边数 = 最大匹配 + (n - 最大匹配 * 2) = n - 最大匹配。
事实上这种构造方式对于任意图都成立。
Hall 定理
对于一个二分图 \(G=(A,B)\),设 \(f(S)\) 为与点集 \(S\) 相连的所有点组成的点集。
那么 \(A\) 中的点全部被匹配当且仅当:对于任意一个 \(A\) 的子集 \(S\),均有 \(|f(S)|\geq |S|\)。
更强地,\(G\) 的最大匹配为 \(|A|-\max\limits_{S\subseteq A}(|S|-|f(S)|)\)。
证明:只证更强的那个结论。记 \(M=\max\limits_{S\subseteq A}(|S|-|f(S)|)\)。
首先,显然最大匹配不超过 \(|A|-M\)。我们只需证明存在一个大小为 \(|A|-M\) 的匹配即可。
假设不存在,那么 \(A\) 中至少存在 \(M+1\) 个非匹配点,任取其中的 \(M+1\) 个,记为 \(S\)。再设 \(T\) 初始为空集。
归纳地假设 \(S\) 中每个点 \(u\) 都存在一条半增广路(从某个左部非匹配点开始,走交错路,一直到达 \(u\)),显然初始时成立。归纳地假设 \(|S|=M+k\),\(|T|=k-1\)(初始时 \(k=1\))。归纳地假设 \(T\) 中都是匹配点,且 \(S\) 中要么是初始的 \(M+1\) 个非匹配点,要么是 \(T\) 中点的匹配点。
根据 \(M\) 的定义可知 \(|f(S)|\geq k\)。于是可以取 \(v\in f(S)\) 且 \(v\not\in T\),那么存在 \(u\in S\) 使得存在边 \((u,v)\)。
若 \(v\) 为非匹配点,根据归纳假设,我们找到了一条先到 \(u\) 再到 \(v\) 的增广路,于是有更大的匹配。
若 \(v\) 为匹配点,将 \(v\) 加入 \(T\) 中,再将 \(match(v)\) 加入 \(S\) 中。
容易证明上述过程一直符合归纳假设,而该过程不可能无限次进行,即一定在某次找到更大的匹配。
k-正则图二分图染色
对于一个 k-正则二分图,最少能够用 \(k\) 种不同的颜色将所有边染色,并使得不存在一个点连出两条同色的边。
必要性显然,充分性只需要证明如下引理即可归纳:
对于一个 k-正则二分图,一定存在一组完美匹配。
证明:考虑使用 Hall 定理证明,考虑左部的任意一个点集 \(S\),它们会连出 \(k|S|\) 条边,而右部的任意一个点的最大度数都为 \(k\),所以 \(To(S)\) 大小至少为 \(|S|\),得证。
构造方法:
显然每一次求一遍最大匹配的时间复杂度是不优的,我们有一种更加优秀的类似匈牙利的做法:
考虑增量法,每次加入一条边 \((u,v)\) 时(不妨设 \(u\) 是左部点,\(v\) 是右部点),我们找到当前 \(u,v\) 各自出边颜色集合的 \(\operatorname{mex}\),分别记为 \(L,R\)。然后我们从 \(v\) 开始走一条极长的 \(L,R,L,R,\cdots\) 的增广路,容易发现过程中一定不会出现环:首先路径上除了 \(u,v\) 之外的点都有 \(L,R\) 两种出边,而之前的图我们已经保证了染色是合法的了,所以成环的那条边不可能接在除了 \(u,v\) 之外的点上;而对于 \(u,v\),由于二分图的性质,当前下一步若要走 \(L\) 则一定连向左部点,若要走 \(R\) 则一定连向右部点,而我们又保证了 \(L,R\) 没在 \(u,v\) 各自的出边颜色集合中出现过,所以成环的那条边也不可能接在 \(u,v\) 上。
找到增广路后,我们直接把这条增广路整体 \(L,R\) 翻转,并把 \((u,v)\) 的颜色设为 \(L\) 即可。
每次都是从 \(u,v\) 出边的颜色集合中取 \(\operatorname{mex}\) 的原因是使得每一个点的出边颜色肯定是 \(0\sim k-1\),符合 \(k\) 染色条件。
由于增广路无环,所以增广路的长度是有限 \(O(n)\) 的,所以这个算法时间复杂度为 \(O(nm)\) 的。
另外提一嘴,这个算法适用于一般的点最大度数为 \(k\) 的二分图的 \(k\) 染色,即无需把图补全为正则图,那样复杂度会退化到 \(O(n^2k)\)。
代码实现也很简单:
int to[N][K];
void dfs(int u,int c1,int c2)
{
if(to[u][c1]) dfs(to[u][c1],c2,c1);
swap(to[u][c1],to[u][c2]);
}
void inse(int u,int v)
{
int cu=0,cv=0;
while(to[u][cu]) cu++;
while(to[v][cv]) cv++;
dfs(v,cu,cv);
to[v][cu]=u,to[u][cu]=v;
}
KM 算法
求二分图最大权完美匹配。设左右各有 \(n\) 个点,左右点集分别记为 \(S,T\)。左边第 \(i\) 个点与右边第 \(j\) 个点间的边权为 \(w_{i,j}\)。
考虑给每个点设置一个权值,左边的为 \(x_i\),右边的为 \(y_j\),满足对于任意边有 \(x_i+y_j\geq w_{i,j}\)。
设原图为 \(G\),\(G'\) 为只保留 \(G\) 中满足 \(x_i+y_j=w_{i,j}\) 的边形成的图,那么若 \(G'\) 存在完美匹配,则这组完美匹配就是 \(G\) 的一组最大权完美匹配,因为它达到了权值的上界 \(\sum x_i+\sum y_j\)。
初始时先令 \(x_i=\max_j w_{i,j}\) 和 \(y_j=0\),然后依次考虑左边的每一个点并在 \(G'\) 中为其找一个匹配。
假设考虑到左边第 \(k\) 个点,它在 \(G'\) 上至少有一条出边(根据 \(x\) 和 \(y\) 的初值),那么在 \(G'\) 上从这个点开始不断走增广路(沿着非匹配边、匹配边交替走)。若在 \(G'\) 上找到了一条完整的增广路那么直接增广。
否则设遍历到的连通块的左侧点集是 \(A\),右侧点集是 \(B\),这里应当满足 \(|A|=|B|+1\),且任意 \(A\) 中的点在 \(G'\) 上的邻点都在 \(B\) 中。在原二分图一定存在完美匹配的前提下,\(A\) 和 \(T\setminus B\) 在 \(G\) 中一定有连边(Hall 定理),找出其中 \(x_i+y_j-w_{i,j}\) 最小的一条 \((i,j)\),并记 \(c=x_i+y_j-w_{i,j}\),这里应当有 \(c>0\)。
然后我们将 \(A\) 中所有点的 \(x_i\) 减等于 \(c\),将 \(B\) 中所有点的 \(y_j\) 加等于 \(c\)。考虑证明仍然有 \(x_i+y_j\geq w_{i,j}\):对于 \(A-B\) 间、\((S\setminus A)-(T\setminus B)\) 间和 \((S\setminus A)-B\) 间的边,条件显然没有更紧,而对于 \(A-(T\setminus B)\) 间的边,由于 \(c\) 是最小的,所以 \(x_i+y_j\geq w_{i,j}\) 应当仍然满足。这里也可以看出:变化后,从 \(G'\) 中消失的边恰是和 \(B\) 相邻的而没有被遍历到的边,且 \((i,j)\) 一定被加入到 \(G'\) 当中。
此时若再重新从 \(k\) 开始遍历,可以看出:原本能遍历到的边仍然能遍历到,而且新的 \(A,B\) 严格变大。而 \(A,B\) 是不可能一直变大的,所以总有一次能找到增广路。
暴力地实现上述算法是 \(O(n^2m)\) 的。注意到若把边看成有向的,那么遍历结果就是 \(k\) 在这个有向图上的可达点,而新加入一些边后,可以直接继承上一轮的 vis 结果,而从这些新加入的边遍历一遍即可。同时,为了找到这些新加入的边以及之前所说的最小的 \(c\) 对应的边,对 \(T\setminus B\) 中每个点 \(j\) 维护所有 \(A\) 中的 \(i\) 的 \(x_i+w_{i,j}\) 的最小值,由于 \(A\) 只会严格变大,所以只需在每次往 \(A\) 中加点和 \(A\) 中 \(x_i\) 整体减时对 \(T\setminus B\) 中每个点都更新一下即可。这样时间复杂度是 \(O(n(n^2+m))=O(n^3)\) 的。代码可以看洛谷。
其他
-
给定二分图 \((A,B,E)\),其中 \(A,B\) 是两部点集,\(E\) 是边集。对于 \(B\) 中的每个点都给定一个点权。定义该二分图上的一个匹配的代价为所有 \(B\) 中的匹配点的点权之和。求在匹配最大的情况下,匹配代价最小可能是多少。
做法:将 \(B\) 中的点按点权从小到大排序,并以这个顺序跑匈牙利算法(按序依次增广),最后跑出来的匹配就是代价最小的最大匹配 \(M\)。
证明:考虑另一个代价更小的最大匹配 \(M'\),并考虑 \(M\) 和 \(M'\) 的对称差,它由若干偶环和偶链组成。注意到偶环异或之后匹配点不变(不管是 \(M\) 还是 \(M'\),整个环都是匹配点);而对于偶链来说,从 \(M\) 变成 \(M'\),点集的变化相当于去掉了链的一头 \(a\),再加入链的另外一头 \(b\)。由于 \(M'\) 的代价比 \(M\) 小,那么必然存在某条链满足 \(a,b\in B\) 且 \(w_b<w_a\),此时 \(b\) 的尝试增广时间比 \(a\) 早。考虑最后一次修改这条链上的边的匹配状态的时候(此时一定已经尝试过从 \(b\) 增广了),显然是对该路径的若干段取反,且每一段的两端在取反后都是匹配边,即在取反前是非匹配边。找到离 \(b\) 最近的那一段,发现可以找到一条从 \(b\) 开始的增广路,这和引理 1 矛盾。
-
对于二分图 \(G\)。设有两组 \(G\) 上的最大匹配 \(M_1,M_2\),其中 \(M_1\) 的左侧匹配点集为 \(L\),\(M_2\) 的右侧匹配点集为 \(R\)。那么存在一组最大匹配,其匹配点集恰为 \(L\cup R\)。
证明:考虑从 \(M_1\) 调整到 \(M_2\)。考虑 \(M_1,M_2\) 的对称差。偶环我们可以忽略。对于偶链,我们可以把链的一端换成另一端,注意到这两端一定同在左部(右部),所以一定不可能同时属于 \(L\)(同时属于 \(R\)),于是根据需要调整即可。
应用:和匈牙利算法结合,求二分图最大点权匹配,或构造钦定匹配点的匹配等。
-
给定二分图 \(G\) 和正整数 \(t\),一定能选出原图边集的一组子集 \(E\),使得对于任意点 \(u\) 都满足 \(|E\cap D(u)|\in\left\{\lfloor \frac{D(u)}{t}\rfloor,\lceil\frac{D(u)}{t}\rceil\right\}\),其中 \(D(u)\) 是 \(u\) 的邻边集合。
证明:拆点即可,若 \(u\) 的度数为 \(d\),那么拆为 \(\lceil\frac{d}{t}\rceil\) 个点并把 \(u\) 的邻边分配给它们,使得前 \(\lfloor\frac{d}{t}\rfloor\) 个点的出度都恰为 \(t\)。然后我们将这张图补成 \(t\) 正则二分图,跑一遍 \(t\) 染色,那么每个点应该恰有一条 1 色邻边,那么就能选出一个边集,使得对于那些本来出度就为 \(t\) 的点,它们在选出的边中恰有一条 1 色邻边(因为它们在新图上的邻边都在原图上)。
或者直接观察 \(t\) 染色的证明,发现可以只需要跑两遍最大流然后再调整即可做到更优的复杂度。
一般图最大匹配——带花树算法
对于一般图最大匹配,我们不能直接套用二分图最大匹配的方法,因为奇环的存在,所以到达一个点时接下来走的边不是确定的。
处理的办法是把奇环消掉:对于一个大小为 \(2k+1\) 的奇环,其内如果已经存在了 \(k\) 对匹配边(达到上界),那么一定存在一个恰好一个节点能向外匹配。同时,通过环内增广,每个节点都可以成为这个向外匹配的点。
于是此时这个奇环和一个点实质上是等价的,我们可以把这个奇环缩成一个点(称为花)。
具体地:
假设当前枚举的起点 \(s\)(未盖点)已经确定了,不妨先当成二分图来做,从 \(s\) 以非匹配边开始 bfs 找增广路。
我们对走出来的这棵交错树中的点按层数奇偶性分成奇点偶点,其中根为偶点。那么树上偶点向奇点的连边一定是非匹配边,奇点向偶点的连边一定是匹配边。
不难发现每次偶点都是直接被奇点直接沿着匹配边得到(相当于二者已经捆绑),于是我们只考虑枚举偶点的出边的情况。
设当前点为 \(u\)(偶点),枚举非匹配边 \((u,v)\):
- 若 \(v\) 未被访问过:若 \(v\) 是未盖点则找到增广路;否则将 \(v\) 的配偶加入队列中。
- 若 \(v\) 被访问过:那么我们找到了一个环。如果是偶环则直接忽略,否则若是奇环,则把环上所有边缩掉缩成一个点并继续找增广路。
意思就是从 \(s\) 开始找增广路,若遇到增广路就直接增广,否则若遇到奇环就把它缩成一个点并把这个新点重新加入队列。最后若没有奇环(已经变成二分图了)且也找不到增广路直接换到下一个起点即可(需要把图清空,因为当前起点缩的奇环对下一个点不一定成立)。
考虑一下这个算法的正确性,我们只需要证明我们找到的奇环和一个点是等价的,即设原图为 \(G\),缩完点后的图为 \(G'\),我们只需要证明:
- 若 \(G\) 中存在增广路,\(G'\) 中也存在增广路。
- 若 \(G'\) 中存在增广路,\(G\) 中也存在增广路。
借用一张论文中的图:
非树边为 \((u,v)\),定义花根 \(h\) 为 \(u,v\) 的最近公共祖先。
由此环是奇环可知 \(u,v\) 深度奇偶性相同,所以 \(v\) 也是偶点。而且若 \(u,v\) 不呈祖先关系那么 \(u,v\) 仅有可能是在树上某个偶点 \(h\) 处沿着两条不同的非匹配边分开的。于是 \(h\) 一定是偶点,交替路 \(s-h\) 形如 “非匹配边-……-匹配边”。
-
若 \(G\) 中存在增广路,\(G'\) 中也存在增广路。
证明:考虑一条 \(G\) 中从 \(s\) 出发的增广路 \(P\),如果我们能通过恰当的构造方式使得 \(P\) 能转化为 \(G\) 中一条同样从 \(s\) 出发、且每次进出奇环的边的匹配性都不同(一条是 \(h\) 的返祖边(匹配边),一条是奇环上的点向外连的非匹配边)的增广路,那 \(P\) 在 \(G'\) 中就肯定能唯一对应一条增广路。
具体地,从前往后截取 \(P\) 中经过该奇环的每一段并分别考虑,假设当前截取的段是从 \(v_{in}\) 进入奇环,从 \(v_{out}\) 离开奇环,即当前 \(P\) 形如 \(s- v_{in}- v_{out}-\cdots\)。
- 若从 \(v_{out}\) 离开奇环时是从某条非匹配边离开的,那么我们直接把路径改写成 \(s-h-v_{out}-\cdots\),其中 \(s-h\) 段是沿树边走,\(h-v_{out}\) 段是沿奇环走(顺时针走/逆时针走中总有一种合法),这条增广路仍然合法,而且进入奇环时是匹配边,离开奇环时是非匹配边。
- 若从 \(v_{out}\) 离开奇环时是从匹配边离开的,那么只可能从 \(h\) 返祖的那条匹配边离开,此时一定是从某条非匹配边进入奇环,已经满足条件了。
-
若 \(G'\) 中存在增广路,\(G\) 中也存在增广路。
证明:比较显然,在 \(G'\) 中经过奇环缩成的点时总有一种方法(顺时针/逆时针)在 \(G\) 中沿奇环复原。
在找到奇环的时候,为了实现方便,我们不 “显式” 地缩点,而是用并查集来记录每个点所在的花的根。而且因为缩起来的点是一个偶点,所以我们需要将环上所有的奇点都改成偶点加入队列中。
为了方便地遍历我们找到的增广路,对每个点存一个前驱 pre 表示这个点出发走一条非匹配边后应该到达哪个节点,即增广路上的上一个点。被缩掉的环上除了 \(h\) 连出的两条非匹配边之外的非匹配边的 pre 应该都是双向的(花内部的走法),在缩环时处理一下。
一个粗略的时间复杂度上界:处理一个奇环的时间是和奇环大小成线性的,而对于单个 \(s\),一个点至多被缩 \(O(n)\) 次奇环,于是对 \(s\) 找增广路的时间是 \(O(n^2)\)。而一共要找 \(O(n)\) 次增广路,所以总时间复杂度为 \(O(n^3)\)。
#include<bits/stdc++.h>
#define N 510
#define M 125000
using namespace std;
inline int read()
{
int x=0,f=1;
char ch=getchar();
while(ch<'0'||ch>'9')
{
if(ch=='-') f=-1;
ch=getchar();
}
while(ch>='0'&&ch<='9')
{
x=(x<<1)+(x<<3)+(ch^'0');
ch=getchar();
}
return x*f;
}
int n,m;
int cnt,head[N],nxt[M<<1],to[M<<1];
int fa[N],dep[N],pre[N],mat[N];
int ntim,tim[N];
void adde(int u,int v)
{
to[++cnt]=v;
nxt[cnt]=head[u];
head[u]=cnt;
}
int find(int x)
{
return x==fa[x]?x:(fa[x]=find(fa[x]));
}
int getlca(int u,int v)
{
ntim++;
while(u)
{
tim[u=find(u)]=ntim;
u=pre[mat[u]];
}
while(1)
{
if(tim[v=find(v)]==ntim) return v;
v=pre[mat[v]];
}
}
queue<int>q;
void update(int u,int v,int h)
{
while(find(u)!=h)
{
pre[u]=v;
v=mat[u],fa[u]=fa[v]=h,u=pre[v];
if(dep[v]==1) dep[v]=2,q.push(v);
}
}
int flower(int st)
{
while(!q.empty()) q.pop();
for(int i=1;i<=n;i++) dep[i]=pre[i]=0,fa[i]=i;
q.push(st),dep[st]=2;
while(!q.empty())
{
int u=q.front();
q.pop();
for(int i=head[u];i;i=nxt[i])
{
int v=to[i];
if(!dep[v])
{
pre[v]=u;
if(!mat[v])
{
int now=v;
while(now)
{
int y=mat[pre[now]];
mat[now]=pre[now];
mat[pre[now]]=now;
now=y;
}
return 1;
}
else
{
dep[v]=1,dep[mat[v]]=2;
q.push(mat[v]);
}
}
else if(dep[v]==2)
{
int h=getlca(u,v);
update(u,v,h),update(v,u,h);
}
}
}
return 0;
}
int main()
{
n=read(),m=read();
for(int i=1;i<=m;i++)
{
int u=read(),v=read();
adde(u,v),adde(v,u);
}
int ans=0;
for(int i=1;i<=n;i++)
if(!mat[i]) ans+=flower(i);
printf("%d\n",ans);
for(int i=1;i<=n;i++)
printf("%d ",mat[i]);
return 0;
}
一般图最大匹配——线性代数法
前置知识
首先是一些有关排列的符号和知识:
对于一个长度为 \(n\) 的排列 \(p\),它也代表着一个置换,这个置换可以看成由若干个环组成(连有向边 \(i\to p_i\))。
我们记置换 \(p\) 的符号为 \(\operatorname{sgn}(p)\),它有两种定义:
- 排列 \(p\) 中的逆序对个数的奇偶性。
- 从排列 \(1,2,\cdots,n\) 通过若干次交换相邻两项的操作得到排列 \(p\) 所需的操作次数的奇偶性。
两种定义是等价的:初始时排列 \(1,2,\cdots,n\) 的逆序对个数为 \(0\),而每次交换相邻两个数会使得逆序对个数奇偶性改变。
声明一下,你可以直接看最后的引理 5,因为引理 2~4 是我姿势水平不够时写的,现在看来有一个更强的结论(引理 5)。
-
引理 2:事实上第二种定义还有一个更强的推论—— \(\operatorname{sgn}(p)\) 的第三种定义:从排列 \(1,2,\cdots,n\) 通过若干次交换任意不同的两项的操作得到排列 \(p\) 所需的操作次数的奇偶性。
证明:假设我们要交换 \(p_i,p_j(i\neq j)\),我们可以通过多次交换相邻两项的操作来实现,发现所需操作数和 \(2|i-j|-1\) 的奇偶性相同,即交换任意不同的两项等价于奇数次交换相邻的两项。
-
引理 3:对于置换 \(a,b\),有 \(\operatorname{sgn}(a \circ b)=\operatorname{sgn}(a)\oplus \operatorname{sgn}(b)\)。
证明:根据第二种或第三种定义,我们可以先通过操作将排列 \(1,2,\cdots,n\) 变到 \(a\)(操作次数奇偶性为 \(\operatorname{sgn}(a)\)),再变到 \(a\circ b\)(操作次数奇偶性为 \(\operatorname{sgn}(b)\)),总操作次数奇偶性为 \(\operatorname{sgn}(a)\oplus \operatorname{sgn}(b)\)。
-
引理 4:对于置换 \(p\),它可以看成由若干个有向环组成,将其中某一个环的边全部反向,\(\operatorname{sgn}(p)\) 不变。
证明:根据引理 \(3\),\(\operatorname{sgn}(p)\) 等于 \(p\) 中每个环的 \(\operatorname{sgn}\) 异或起来,所以我们只需要关心这个环的 \(\operatorname{sgn}\) 值有没有变化。
此时需要再用回 \(\operatorname{sgn}\) 的第一种定义。考虑这个环其实在排列中代表了若干个位置,记它们的集合为 \(I\)。那么这个环的 \(\operatorname{sgn}\) 相当于是二元组集合 \(\{(i,a_i)|i\in I\}\) 中的逆序对个数的奇偶性。而将环反向后,原来的边 \(i\to a_i\) 变为了边 \(a_i\to i\),也就是说二元组集合变成了 \(\{(a_i,i)|i\in I\}\),很显然这个二元组集合的逆序对个数和原来的二元组集合的逆序对个数是相同的,所以这个环反向后 \(\operatorname{sgn}\) 依然没有变化。
-
引理 5:对于置换 \(p\),它可以看成由若干个有向环组成,\(\operatorname{sgn}(p)\) 等于 \(n-\text{环个数}\) 的奇偶性。
证明:发现 \(\operatorname{sgn}(p)\) 的第二种定义一次交换一定会改变环的奇偶性(断环或连成环),而初始时有 \(n\) 个自环,然后就易证了。
然后是一些有关线性代数的符号和知识:对于一个 \(m\) 行 \(n\) 列(\(m\times n\))的矩阵 \(A\) 以及任意 \(I\subseteq\{1,\cdots,m\},J\subseteq\{1,\cdots,n\}\),我们记 \(A\) 中保留 \(I\) 中的行和 \(J\) 中的列得到的子矩阵为 \(A_{I,J}\),而记 \(A\) 中删去 \(I\) 中的行和 \(J\) 中的列得到的子矩阵为 \(A^{I,J}\)。记 \(\operatorname{rank} A\) 为矩阵的秩。
Tutte 矩阵和 Tutte 定理
对于一个无向图 \(G=(V,E)\),定义 \(G\) 的 Tutte 矩阵为一个 \(n\times n\) 的矩阵 \(\tilde{A}(G)\), 其中:
其中 \(x_{i,j}\) 是 \(|E|\) 个独立的变量。
定义图 \(G\) 的一个环覆盖是指选出 \(E\) 中的一些边组成若干个不交的简单环(可以是单边形成二元环)去覆盖 \(G\) 中所有的点。形式化地, 图 \(G\) 的每个环覆盖对应了 \(1\sim n\) 的一个排列 \(\pi\),满足 \((i,\pi_i)\in E\)。
如果这个环覆盖中的所有环的长度都是偶数,那么我们称这是一个偶环覆盖,否则我们称其是一个奇环覆盖。
-
引理 5:图 \(G\) 有完美匹配当且仅当图 \(G\) 有一个偶环覆盖。
证明:必要性:那么我们直接用完美匹配中每一对点构成的二元环就可以覆盖图 \(G\) 了。
充分性:我们在每一个偶环中隔一条边取一条边,就能够得到 \(G\) 的一个完美匹配了。
-
定理 2(Tutte 定理):图 \(G\) 有完美匹配当且仅当 \(\det \tilde{A}(G)\neq 0\)。
证明:我们有:
\[\det \tilde{A}(G)=\sum_{\pi}(-1)^{\operatorname{sgn}(\pi)}\prod_{i=1}^n\tilde{A}(G)_{i,\pi_i} \]右侧的非零项形如 \((-1)^{\operatorname{sgn}(\pi)}\prod\limits_{i=1}^n \pm x_{i,\pi_i}\),其中 \(\forall i,(i,\pi_i)\in E\),这些边构成了 \(G\) 的一个环覆盖(边有向)。
注意到,如果这个环覆盖 \(\pi\) 是一个奇环覆盖,那么我们考虑将其中编号最小的奇环上的边都反向,这对应了另一个环覆盖 \(\pi'\)(且这个环覆盖也对应它),根据引理4或引理5可知此时 \(\operatorname{sgn}(\pi’)\) 没有变化,但改变了这个环中所有变量 \(x_{i,\pi_i}\) 的符号,所以此时 \(\pi'\) 的贡献与 \(\pi\) 的贡献相反。
那么所有 \(\pi\) 是奇环覆盖的贡献都会被抵消掉,所以若图 \(G\) 没有偶环覆盖,则必有 \(\det \tilde{A}(G)= 0\)。
接下来考虑偶环覆盖的贡献。由于每条边 \((u,v)\) 所代表的变量 \(x_{u,v}\) 都是相互独立的,所以两种环覆盖 \(\pi,\pi'\) 的贡献有可能抵消掉的必要条件是两种环覆盖所选出来的边集都是一样的(这里的边集是指无向边的集合)。
那么我们考虑每一类偶环覆盖,同一类内边集相同,这些边组成一个还未给边定向的偶环覆盖。根据上面的证明过程同理可知若我们对环覆盖 \(\pi\) 中的某个偶环上的边全部反向得到环覆盖 \(\pi'\),\(\pi'\) 的贡献和 \(\pi\) 的贡献是相同的。那么无论我们怎么给这个偶环覆盖上的环定向,所得到的贡献总是相同的,那么它们之间就不可能相互抵消。
于是,若图 \(G\) 存在偶环覆盖,则必有 \(\det \tilde{A}(G)\neq 0\),是个非零多项式。
随机化
Tutte 定理给了我们一个非常好的判定图 \(G\) 是否存在完美匹配的算法:我们只需要判断 \(\det \tilde{A}(G)\) 是否等于 \(0\) 即可。但这个做法有一个显著的问题:由于 Tutte 矩阵的每一项都是一个变量,而变量的总数高达 \(O(|E|)\) 个,所以直接求其行列式时需要动态维护多项式,那就不能直接高斯消元,时间复杂度甚至是指数级的。
然而,我们只需要判断 \(\det \tilde{A}(G)\) 是否为恒为 \(0\)。这是一个很经典的问题:对于一个 \(n\) 元多项式 \(F(x_1,\cdots,x_n)\),我们要判断它是否恒为 \(0\)。我们可以使用随机化。
-
引理 6(Schwartz-Zippel 引理):对于域 \(\mathbb{F}\) 上的一个不恒为 \(0\) 的 \(n\) 元 \(d\) 度多项式 \(F(x_1,\cdots,x_n)\),设 \(r_1,\cdots,r_n\) 为 \(n\) 个 \(\mathbb{F}\) 中的独立选取的随机数,则:
\[Pr[F(r_1,\cdots,r_n)=0]\leq \frac{d}{|\mathbb{F}|} \]其中多项式的度数为其每个单项式度数的最大值(如单项式 \(2x^2y\) 度数为 \(3\))。
证明:使用归纳证明。
-
对于单变量(\(n=1\))的情况,此时 \(F\) 至多有 \(d\) 个根,我们恰好选到其中一个的概率不超过 \(\frac{d}{|\mathbb F|}\)。
-
对于 \(n>1\) 的情况,假设定理对于 \(n-1\) 的情况都成立,我们考虑把 \(F\) 看成以 \(x_1\) 为主元的多项式:
\[F(x_1,\cdots,x_n)=\sum_{i=0}^dx_1^iF_i(x_2,\cdots,x_n) \]根据定义,我们有 \(\deg F_i\leq d-i\)。
由于 \(F\) 不恒为 \(0\),所以必定存在至少一个 \(i\) 使得 \(F_i\) 不恒为 \(0\),找到最大的这样的 \(i\)。
根据归纳假设,\(Pr[F_i(r_2,\cdots,r_n)=0]\leq \frac{d-i}{|\mathbb{F}|}\)。
若 \(F_i(r_2,\cdots,r_n)\neq 0\),则 \(F(x_1,\cdots,x_n)\) 为关于 \(x_1\) 的一元 \(i\) 次多项式,有:
\[Pr[F(r_1,\cdots,r_n)=0|F_i(r_2,\cdots,r_n)\neq 0]\leq \frac{i}{|\mathbb{F}|} \]设 \(F(r_1,\cdots,r_n)=0\) 为事件 \(A\),\(F_i(r_2,\cdots,r_n)\) 为事件 \(B\),那么:
\[\begin{aligned} Pr[A]&=Pr[A\cap B]+Pr[A\cap\bar B]\\ &=Pr[A|B]Pr[B]+Pr[A|\bar B]Pr[\bar B]\\ &\leq Pr[B]+Pr[A|\bar B]\\ &\leq \frac{d-i}{|\mathbb F|}+\frac{i}{|\mathbb F|}=\frac{d}{|\mathbb F|} \end{aligned} \]
-
我们知道多项式,\(\det \tilde A(G)\) 的度是 \(O(n)\) 级别的。因此我们不妨选取一个大质数 \(p\),将运算在模 \(p\) 意义下进行,并通过为每个变量赋随机值的方式来判定图 \(G\) 是否存在完美匹配。由引理6可知,该算法错误的概率不超过 \(\frac{n}{p}\),可以接受(实在不行搞多一次)。
至此,我们得到了一个 \(O(n^3)\) 的算法判定图 \(G\) 是否存在完美匹配。
构造完美匹配方案
咕。
求解最大匹配
咕。
Pfaffian 值(选读)
这一节仅为知识拓展,和一般图最大匹配的线性代数算法无关。
令 \(k=\frac{n}{2}\),定义 \(\tilde A(G)\) 的 Pfaffian 值为:
从组合意义角度考虑,可以看作是枚举了完美匹配并统计了它们的贡献。
-
引理 7:对于长为 \(2k\) 的排列 \(\pi\),任意交换 \((\pi_{2i-1},\pi_{2i})\) 和 \((\pi_{2j-1},\pi_{2j})\),\(\operatorname{sgn}(\pi)\) 不会变化。
证明:注意到任意交换连续四项的前两项和后两项,\(\operatorname{sgn}(\pi)\) 不会变化。
我们可以发现对于任意一种完美匹配(无向),它对于 \(\text{Pf}(\tilde A(G))\) 的贡献都相同:首先交换边与边之间的顺序不会影响贡献,而将一条边反向后,\(\operatorname{sgn}(\pi)\) 和 \(\prod\) 中的符号同时改变,故总体的符号也不变。
更具体地,一种完美匹配被统计的次数恰为 \(k!2^k\) 次,前者是边与边之间的顺序,后者是每条边的定向。
于是 \(\text{Pf}(\tilde A(G))\) 可以看做是枚举每一种完美匹配,并恰好统计一次其贡献。
事实上,Tutte 矩阵 \(\tilde A(G)\) 与其 Pfaffian 值有着更加紧密的联系,我们直接给出结论:
-
定理 3(Cayley 定理):
\[\text{Pf}(\tilde A(G))^2=\det \tilde A(G) \]证明:考虑 \(\text{Pf}(\tilde A(G))^2\) 的组合意义:它相当于枚举了两组完美匹配并统计二者贡献的乘积。
而两组完美匹配恰好对应一组偶环覆盖(每个点度数为 \(2\)),那么我们不妨提取出某一组偶环覆盖 \(S\)(假设其中有 \(m\) 个偶环),并且查看它在等式左右的贡献。
根据刚刚的推导和 Tutte 定理的证明过程,我们可以知道 \(S\) 在等式左边或右边每次被统计时的贡献都是相同的,所以我们只需证明 \(S\) 在等式左右的单次贡献相同,以及在等式左右被统计的次数相同即可。
先看统计次数:
-
等式右边:每个偶环有正向和反向之分,所以 \(S\) 在等式右边被统计的次数为 \(2^m\)。
-
等式左边:我们知道,一个偶环 \(R\) 被分解为两组完美匹配 \(A,B\) 的方案是唯一的。那么对于 \(R\) 而言,他在 \(\text{Pf}(\tilde A(G))\cdot \text{Pf}(\tilde A(G))\) 中就只有 “前者 \(A\) 后者 \(B\)” 或 “前者 \(B\) 后者 \(A\)” 两种可能。于是 \(S\) 在等式左边被统计的次数即为 \(2^{m}\)。
再看单次贡献:那么不妨设这组偶环覆盖为 \(S=\{\{p_{1,1},\cdots,p_{1,s_1}\},\cdots,\{p_{m,1},\cdots,p_{m,s_m}\}\}\),且第一组完美匹配为 \(B_1=\{(p_{1,1},p_{1,2}),\cdots,(p_{1,s_1-1},p_{1,s_1}),\cdots\}\),那么第二组完美匹配应为 \(B_2=\{(p_{1,2},p_{1,3}),\cdots,(p_{1,s_1},p_{1,1}),\cdots\}\)。
-
等式右边:结合引理5可推知,单次贡献为 \((-1)^{n-m}\prod_{i=1}^{m}\prod_{j=1}^{s_i}\tilde A(G)_{p_{i,j},p_{i,j+1}}\)。
-
等式左边:可以直接设 \(B_1\) 对应的排列为 \(\pi_1=\{p_{1,1},p_{1,2},\cdots,p_{1,s_1-1},p_{1,s_1},\quad p_{2,1},p_{2,2},\cdots,p_{2,s_2-1},p_{2,s_2},\quad \cdots\}\),\(B_2\) 对应的排列为 \(\pi_2=\{p_{1,2},p_{1,3},\cdots,p_{1,s_1},p_{1,1},\quad p_{2,2},p_{2,3},\cdots,p_{2,s_2},p_{2,1},\quad \cdots\}\)。那么单次贡献显然为:
\[(-1)^{\operatorname{sgn}(\pi_1)}(-1)^{\operatorname{sgn}(\pi_2)}\prod_{i=1}^m\prod_{j=1}^{s_i}\tilde A(G)_{p_{i,j},p_{i,j+1}} \]比较 \(\operatorname{sgn}(\pi_1)\) 和 \(\operatorname{sgn}(\pi_2)\) 的异同:发现我们只需将 \(\pi_2\) 中每个环 \(i\) 的 \(p_{i,1}\) 移动至该环最前面(一共会造成奇数次交换),就能使 \(\pi_1\) 和 \(\pi_2\) 相同而抵消。所以 \((-1)^{\operatorname{sgn}(\pi_1)}(-1)^{\operatorname{sgn}(\pi_2)}=(-1)^{m}\)。
在 \(n\) 一定为偶数的情况下,\((-1)^{n-m}\) 和 \((-1)^m\) 相等,故二者单次贡献相同。
-
Cayley 定理有许多应用。例如,当我想统计每种完美匹配中的边的贡献和而非每种偶环覆盖中所有边的贡献和时,就可以先求出 Tutte 矩阵的行列式再开方得到其 Pfaffian 值。