To hxq

## 引入

???+ note "入门例题"
假设班里有 10 个学生喜欢数学,15 个学生喜欢语文,21 个学生喜欢编程,班里至少喜欢一门学科的有多少个学生呢?

10+15+21=46 个吗?不是的,因为有些学生可能同时喜欢数学和语文,或者语文和编程,甚至还有可能三者都喜欢。

为了叙述方便,我们把喜欢语文、数学、编程的学生集合分别用 A,B,C 表示,则学生总数等于 |ABC|。刚才已经讲过,如果把这三个集合的元素个数 |A|,|B|,|C| 直接加起来,会有一些元素重复统计了,因此需要扣掉 |AB|,|BC|,|CA|,但这样一来,又有一小部分多扣了,需要加回来,即 |ABC|。即

|ABC|=|A|+|B|+|C||AB||BC||CA|+|ABC|

![容斥原理 - venn 图示例](./images/incexcp.png)

把上述问题推广到一般情况,就是我们熟知的容斥原理。

## 定义

设 U 中元素有 n 种不同的属性,而第 i 种属性称为 Pi,拥有属性 Pi 的元素构成集合 Si,那么

|i=1nSi|=i|Si|i<j|SiSj|+i<j<k|SiSjSk|+(1)m1ai<ai+1|i=1mSai|++(1)n1|S1Sn|

|i=1nSi|=m=1n(1)m1ai<ai+1|i=1mSai|

### 证明

对于每个元素使用二项式定理计算其出现的次数。对于元素 x,假设它出现在 T1,T2,,Tm 的集合中,那么它的出现次数为

Cnt=|{Ti}||{TiTj|i<j}|++(1)k1|{i=1kTai|ai<ai+1}|++(1)m1|{T1Tm}|=(m1)(m2)++(1)m1(mm)=(m0)i=0m(1)i(mi)=1(11)m=1

于是每个元素出现的次数为 1,那么合并起来就是并集。证毕。

### 补集

对于全集 U 下的 **集合的并** 可以使用容斥原理计算,而集合的交则用全集减去 **补集的并集** 求得:

|i=1nSi|=|U||i=1nSi¯|

右边使用容斥即可。

可能接触过容斥的读者都清楚上述内容,而更关心的是容斥的应用

那么接下来我们给出 3 个层次不同的例题来为大家展示容斥原理的应用。

## 不定方程非负整数解计数

???+ note "不定方程非负整数解计数"
给出不定方程 i=1nxi=mn 个限制条件 xibi,其中 m,biN. 求方程的非负整数解的个数。

### 没有限制时

如果没有 xi<bi 的限制,那么不定方程 i=1nxi=m 的非负整数解的数目为 (m+n1n1).

略证:插板法。

相当于你有 m 个球要分给 n 个盒子,允许某个盒子是空的。这个问题不能直接用组合数解决。

于是我们再加入 n1 个球,于是问题就变成了在一个长度为 m+n1 的球序列中选择 n1 个球,然后这个 n1 个球把这个序列隔成了 n 份,恰好可以一一对应放到 n 个盒子中。那么在 m+n1 个球中选择 n1 个球的方案数就是 (m+n1n1)

### 容斥模型

接着我们尝试抽象出容斥原理的模型:

1. 全集 U:不定方程 i=1nxi=m 的非负整数解
2. 元素:变量 xi.
3. 属性:xi 的属性即 xi 满足的条件,即 xibi 的条件

目标:所有变量满足对应属性时集合的大小,即 |i=1nSi|.

这个东西可以用 |i=1nSi|=|U||i=1nSi¯| 求解。|U| 可以用组合数计算,后半部分自然使用容斥原理展开。

那么问题变成,对于一些 Sai¯ 的交集求大小。考虑 Sai¯ 的含义,表示 xaibai+1 的解的数目。而交集表示同时满足这些条件。因此这个交集对应的不定方程中,有些变量有 **下界限制**,而有些则没有限制。

能否消除这些下界限制呢?既然要求的是非负整数解,而有些变量的下界又大于 0,那么我们直接 **把这个下界减掉**,就可以使得这些变量的下界变成 0,即没有下界啦。因此对于

|ai<ai+11ikSai|

的不定方程形式为

i=1nxi=mi=1k(bai+1)

于是这个也可以组合数计算啦。这个长度为 ka 数组相当于在枚举子集。

## HAOI2008 硬币购物

???+ note "HAOI2008 硬币购物"
4 种面值的硬币,第 i 种的面值是 Cin 次询问,每次询问给出每种硬币的数量 Di 和一个价格 S,问付款方式。

n103,S105.

如果用背包做的话复杂度是 O(4nS),无法承受。这道题最明显的特点就是硬币一共只有四种。抽象模型,其实就是让我们求方程 i=14Cixi=S,xiDi 的非负整数解的个数。

采用同样的容斥方式,xi 的属性为 xiDi. 套用容斥原理的公式,最后我们要求解

i=14Cixi=Si=1kCai(Dai+1)

也就是无限背包问题。这个问题可以预处理,算上询问,总复杂度 O(4S+24n)

??? note "代码实现"
```cpp
--8<-- "docs/math/code/inclusion-exclusion-principle/inclusion-exclusion-principle_1.cpp"
```

## 完全图子图染色问题

前面的三道题都是容斥原理的正向运用,这道题则需要用到容斥原理逆向分析。

???+ note "完全图子图染色问题"
A 和 B 喜欢对图(不一定连通)进行染色,而他们的规则是,相邻的结点必须染同一种颜色。今天 A 和 B 玩游戏,对于 n 阶 **完全图** G=(V,E)。他们定义一个估价函数 F(S),其中 S 是边集,SE.F(S) 的值是对图 G=(V,S)m 种颜色染色的总方案数。他们的另一个规则是,如果 |S| 是奇数,那么 A 的得分增加 F(S),否则 B 的得分增加 F(S). 问 A 和 B 的得分差值。

### 数学形式

一看这道题的算法趋向并不明显,因此对于棘手的题目首先抽象出数学形式。得分差即为奇偶对称差,可以用 -1 的幂次来作为系数。我们求的是

Ans=SE(1)|S|1F(S)

### 容斥模型

相邻结点染同一种颜色,我们把它当作属性。在这里我们先不遵守染色的规则,假定我们用 m 种颜色直接对图染色。对于图 G=(V,S),我们把它当作 **元素**。**属性** xi=xj 的含义是结点 i,j 染同色(注意,并未要求 i,j 之间有连边)。

而属性 xi=xj 对应的 **集合** 定义为 Qi,j,其含义是所有满足该属性的图 G 的染色方案,集合的大小就是满足该属性的染色方案数,集合内的元素相当于所有满足该属性的图 G 的染色图。

回到题目,「相邻的结点必须染同一种颜色」,可以理解为若干个 Q 集合的交集。因此可以写出

F(S)=|(i,j)SQi,j|

上述式子右边的含义就是说对于 S 内的每一条边 (i,j) 都满足 xi=xj 的染色方案数,也就是 F(S).

是不是很有容斥的味道了?由于容斥原理本身没有二元组的形式,因此我们把 **所有** 的边 (i,j) 映射到 T=n(n+1)2 个整数上,假设将 (i,j) 映射为 k,1kT,同时 Qi,j 映射为 Qk. 那么属性 xi=xj 则定义为 Pk.

同时 S 可以表示为若干个 k 组成的集合,即 SK={k1,k2,,km}.(也就是说我们在边集与数集间建立了等价关系)。

而 E 对应集合 M={1,2,,n(n+1)2}. 于是乎

F(S)F({ki})=|kiQki|

### 逆向分析

那么要求的式子展开

Ans=KM(1)|K|1|kiKQki|=i|Qi|i<j|QiQj|+i<j<k|QiQjQk|+(1)T1|i=1TQi|

于是就出现了容斥原理的展开形式,因此对这个式子逆向推导

Ans=|i=1TQi|

再考虑等式右边的含义,只要满足 1T 任一条件即可,也就是存在两个点同色(不一定相邻)的染色方案数!而我们知道染色方案的全集是 U,显然 |U|=mn. 而转化为补集,就是求两两异色的染色方案数,即 Amn=m!n!. 因此

Ans=mnAmn

解决这道题,我们首先抽象出题目数学形式,然后从题目中信息量最大的条件,F(S) 函数的定义入手,将其转化为集合的交并补。然后将式子转化为容斥原理的形式,并 **逆向推导** 出最终的结果。这道题体现的正是容斥原理的逆用。

## 数论中的容斥

使用容斥原理能够巧妙地求解一些数论问题。

### 容斥原理求最大公约数为 k 的数对个数

考虑下面的问题:

???+ note " 求最大公约数为 k 的数对个数 "
1x,yNf(k) 表示最大公约数为 k 的有序数对 (x,y) 的个数,求 f(1)f(N) 的值。

这道题固然可以用欧拉函数或莫比乌斯反演的方法来做,但是都不如用容斥原理来的简单。

由容斥原理可以得知,先找到所有以 k 为 **公约数** 的数对,再从中剔除所有以 k 的倍数为 **公约数** 的数对,余下的数对就是以 k 为 **最大公约数** 的数对。即 f(k)=k 为 **公约数** 的数对个数 k 的倍数为 **公约数** 的数对个数。

进一步可发现,以 k 的倍数为 **公约数** 的数对个数等于所有以 k 的倍数为 **最大公约数** 的数对个数之和。于是,可以写出如下表达式:

f(k)=(N/k)2i=2ikNf(ik)

由于当 k>N/2 时,我们可以直接算出 f(k)=(N/k)2,因此我们可以倒过来,从 f(N) 算到 f(1) 就可以了。于是,我们使用容斥原理完成了本题。

```cpp
for (long long k = N; k >= 1; k--) {
f[k] = (N / k) * (N / k);
for (long long i = k + k; i <= N; i += k) f[k] -= f[i];
}
```

上述方法的时间复杂度为 O(i=1NN/i)=O(Ni=1N1/i)=O(NlogN)

附赠三倍经验供大家练手。

- [Luogu P2398 GCD SUM](https://www.luogu.com.cn/problem/P2398)
- [Luogu P2158SDOI2008 仪仗队](https://www.luogu.com.cn/problem/P2158)
- [Luogu P1447NOI2010 能量采集](https://www.luogu.com.cn/problem/P1447)

### 容斥原理推导欧拉函数

考虑下面的问题:

???+ note "欧拉函数公式"
求欧拉函数 φ(n)。其中 φ(n)=|{1xn|gcd(x,n)=1}|

直接计算是 O(nlogn) 的,用线性筛是 O(n) 的,杜教筛是 O(n23) 的(话说一道数论入门题用容斥做为什么还要扯到杜教筛上),接下来考虑用容斥推出欧拉函数的公式

判断两个数是否互质,首先分解质因数

n=i=1kpici

那么就要求对于任意 pix 都不是 pi 的倍数,即 pix. 把它当作属性,对应的集合为 Si,因此有

φ(n)=|i=1kSi|=|U||i=1kSi¯|

全集大小 |U|=n,而 Si¯ 表示的是 pix 构成的集合,显然 |Si¯|=npi,并由此推出

|ai<ai+1Sai|=npai

因此可得

φ(n)=ninpi+i<jnpipj+(1)knp1p2pn=n(11p1)(11p2)(11pk)=ni=1k(11pi)

这就是欧拉函数的数学表示啦

## 容斥原理一般化

容斥原理常用于集合的计数问题,而对于两个集合的函数 f(S),g(S),若

f(S)=TSg(T)

那么就有

g(S)=TS(1)|S||T|f(T)

### 证明

接下来我们简单证明一下。我们从等式的右边开始推:

TS(1)|S||T|f(T)=TS(1)|S||T|QTg(Q)=Qg(Q)QTS(1)|S||T|

我们发现后半部分的求和与 Q 无关,因此把后半部分的 Q 剔除:

=Qg(Q)T(SQ)(1)|SQ||T|

记关于集合 P 的函数 F(P)=TP(1)|P||T|,并化简这个函数:

F(P)=TP(1)|P||T|=i=0|P|C|P|i(1)|P|i=i=0|P|C|P|i1i(1)|P|i=(11)|P|=0|P|

因此原来的式子的值是

Qg(Q)T(SQ)(1)|SQ||T|=Qg(Q)F(SQ)=Qg(Q)0|SQ|

分析发现,仅当 |SQ|=0 时有 00=1,这时 Q=S,对答案的贡献就是 g(S),其他时侯 0|SQ|=0,则对答案无贡献。于是得到

Qg(Q)0|SQ|=g(S)

综上所述,得证。

### 推论

该形式还有这样一个推论。在全集 U 下,对于函数 f(S),g(S),如果

f(S)=STg(T)

那么

g(S)=ST(1)|T||S|f(T)

这个推论其实就是补集形式,证法类似。

## DAG 计数

???+ note "DAG 计数"
n 个点带标号的有向无环图进行计数,对 109+7 取模。n5×103

### 直接 DP

考虑 DP,定义 f[i,j] 表示 i 个点的 DAG,有 j 点个入度为 0 的图的个数。假设去掉这 j 个点后,有 k 个点入度为 0,那么在去掉前这 k 个点至少与这 j 个点中的某几个有连边,即 2j1 种情况;而这 j 个点除了与 k 个点连边,还可以与剩下的点任意连边,有 2ijk 种情况。因此方程如下:

f[i,j]=(ij)k=1ij(2j1)k2(ijk)jf[ij,k]

计算上式的复杂度是 O(n3) 的。

### 放宽限制

上述 DP 的定义是恰好 j 个点入度为 0, 太过于严格,可以放宽为至少 j 个点入度为 0。直接定义 f[i] 表示 i 个点的 DAG 个数。可以直接容斥。考虑选出的 j 个点,这 j 个点可以和剩下的 ij 个点有任意的连边,即 (2ij)j=2(ij)j 种情况:

f[i]=j=1i(1)j1(ij)2(ij)jf[ij]

计算上式的复杂度是 O(n2) 的。

## Min-max 容斥

对于满足全序关系并且其中元素满足可加减性的序列 {xi},设其长度为 n,并设 S={1,2,3,,n},则有:

maxiSxi=TS(1)|T|1minjTxj

miniSxi=TS(1)|T|1maxjTxj

??? note "全序关系"
对于集合 X,若 X 满足全序关系,则下列陈述对于任意 a,b,cX 都成立:

- 反对称性:若 abba,则 a=b;
- 传递性:若 abbc,则 ac
- 完全性:ab 或者 ba

**证明:** 考虑做一个到一般容斥原理的映射。对于 xS,假设 x 是第 k 大的元素。那么我们定义一个映射 f:x{1,2,,k}。显然这是一个双射。

那么容易发现,对于 x,ySf(min(x,y))=f(x)f(y)f(max(x,y))=f(x)f(y)。因此我们得到:

|f(maxiSxi)|=|iSf(xi)|=TS(1)|T|1|jTf(xj)|=TS(1)|T|1|f(minjTxj)|

然后再把 |f(maxiSxi)| 映射回 maxiSxi,而 min 是类似的。

**证毕**

但是你可能觉得这个式子非常蠢,最大值明明可以直接求。之所以 min-max 容斥这么重要,是因为它在期望上也是成立的,即:

E(maxiSxi)=TS(1)|T|1E(minjTxj)

E(miniSxi)=TS(1)|T|1E(maxjTxj)

**证明:** 我们考虑计算期望的一种方法:

E(maxiSxi)=yP(y=x)maxjSyj

其中 y 是一个长度为 n 的序列。

我们对后面的 max 使用之前的式子:

E(maxiSxi)=yP(y=x)maxjSyj=yP(y=x)TS(1)|T|1minjTyj

调换求和顺序:

E(maxiSxi)=yP(y=x)TS(1)|T|1minjTyj=TS(1)|T|1yP(y=x)minjTyj=TS(1)|T|1E(minjTyj)

min 是类似的。

**证毕**

还有更强的:

kthmaxxiiS=TS(1)|T|k(|T|1k1)minjTxj

kthminxiiS=TS(1)|T|k(|T|1k1)maxjTxj

E(kthmaxxiiS)=TS(1)|T|k(|T|1k1)E(minjTxj)

E(kthminxiiS)=TS(1)|T|k(|T|1k1)E(maxjTxj)

规定若 n<m,则 (nm)=0

**证明:** 不妨设 1i<n,xixi+1。则有:

TS(1)|T|k(|T|1k1)minjTxj=iSxiTS(1)|T|k(|T|1k1)[xi=minjTxj]=iSxij=kn(nij1)(j1k1)(1)jk

又因为有组合恒等式:(ab)(bc)=(ac)(acbc),所以有:

TS(1)|T|k(|T|1k1)minjTxj=iSxij=kn(nij1)(j1k1)(1)jk=iSxij=kn(nik1)(nik+1jk)(1)jk=iS(nik1)xij=kn(nik+1jk)(1)jk=iS(nik1)xij=0nik+1(nik+1j)(1)j

i=nk+1 时:

(nik1)j=0nik+1(nik+1j)(1)j=1

否则:

(nik1)j=0nik+1(nik+1j)(1)j=0

所以:

iS(nik1)xij=0nik+1(nik+1j)(1)j=kthmaxiSxi

剩下三个是类似的。

**证毕**

根据 min-max 容斥,我们还可以得到下面的式子:

lcmiSxi=TS(gcdjTxj)(1)|T|1

因为 lcm,gcd,a1,a1 分别相当于 max,min,+,,就是说相当于对于指数做了一个 min-max 容斥,自然就是对的了

## PKUWC2018 随机游走

???+ note "[PKUWC2018 随机游走](https://loj.ac/problem/2542)"
给定一棵 n 个点的树,你从 x 出发,每次等概率随机选择一条与所在点相邻的边走过去。

Q 次询问。每次询问给出一个集合 S,求如果从 x 出发一直随机游走,直到点集 S 中的点都至少经过一次的话,期望游走几步。

特别地,点 x(即起点)视为一开始就被经过了一次。

998244353 取模。

1n18,1Q5000,1|S|n

期望游走的步数也就是游走的时间。那么设随机变量 xi 表示第一次走到结点 i 的时间。那么我们要求的就是

E(maxiSxi)

使用 min-max 容斥可以得到

E(maxiSxi)=E(TS(1)|T|1miniTxi)=TS(1)|T|1E(miniTxi)

对于一个集合 T[n],考虑求出 F(T)=E(miniTxi)

考虑 E(miniTxi) 的含义,是第一次走到 T 中某一个点的期望时间。不妨设 f(i) 表示从结点 i 出发,第一次走到 T 中某个结点的期望时间。

- 对于 iT,有 f(i)=0
- 对于 iT,有 f(i)=1+1deg(i)(i,j)Ef(j)

如果直接高斯消元,复杂度 O(n3)。那么我们对每个 T 都计算 F(T) 的总复杂度就是 O(2nn3),不能接受。我们使用树上消元的技巧。

不妨设根结点是 1,结点 u 的父亲是 pu。对于叶子结点 if(i) 只会和 i 的父亲有关(也可能 f(i)=0,那样更好)。因此我们可以把 f(i) 表示成 f(i)=Ai+Bif(pi) 的形式,其中 Ai,Bi 可以快速计算。

对于非叶结点 i,考虑它的儿子序列 j1,,jk。由于 f(je)=Aje+Bjef(i)。因此可以得到

f(i)=1+1deg(i)e=1k(Aje+Bjef(i))+f(pi)deg(i)

那么变换一下可以得到

f(i)=deg(i)+e=1kAjedeg(i)e=1kBje+f(pi)deg(i)e=1kBje

于是我们把 f(i) 也写成了 Ai+Bif(pi) 的形式。这样可以一直倒推到根结点。而根结点没有父亲。也就是说

f(1)=deg(1)+e=1kAjedeg(1)e=1kBje

解一下这个方程我们就得到了 f(1),再从上往下推一次就得到了每个点的 f(i)。那么 F(T)=f(x)。时间复杂度 O(n)

这样,我们可以对于每一个 T 计算出 F(T),时间复杂度 O(2nn)

回到容斥的部分,我们知道 E(maxiSxi)=TS(1)|T|1F(T)

不妨设 F(T)=(1)|T|1F(T),那么进一步得到 E(maxiSxi)=TSF(T)。因此可以使用 FMT(也叫子集前缀和,或者 FWT 或变换)在 O(2nn) 的时间内对每个 S 计算出 E(maxiSxi),这样就可以 O(1) 回答询问了。

## 参考文献

王迪《容斥原理》,2013 年信息学奥林匹克中国国家队候选队员论文集

[Cyhlnj《有标号的 DAG 计数系列问题》](https://blog.csdn.net/oi_konnyaku/article/details/84862271)

[Wikipedia - 全序关系](https://en.wikipedia.org/wiki/Total_order)

posted @   sandom  阅读(68)  评论(2编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话
历史上的今天:
2022-07-20 虚树
点击右上角即可分享
微信分享提示