Processing math: 0%

『组合数学总结1:基础组合数学和组合原理』

Parsnip·2020-03-18 16:44·4406 次阅读

『组合数学总结1:基础组合数学和组合原理』

Preface#

前排提示:本文数学公式较多,加载LATEX需要一定时间,可能会导致浏览器暂时卡顿,请耐心等待数学公式正常显示.

组合数学知识点的总结,本来准备写在一起的,结果发现字数有点多,导致\mathrm{markdown}编辑器频繁卡顿,那就分三篇发布好了.

\mathrm{Update}:目前第一篇就是组合基础和组合原理,预计第二篇基础高数,生成函数和特殊计数数列,第三篇多项式算法,至于会不会咕咕咕那就不知道了.

基本组合数学#

一些定义和符号#

1.n!表示n的阶乘,n!=1\times 2\times \cdots \times n,用n^{\underline k}表示下降阶乘幂,简称下降幂,n^{\underline k}=n\times (n-1)\times \cdots \times (n-k+1),用n^{\overline k}表示上升阶乘幂,简称上升幂,n^{\overline k}=n\times (n+1)\times \cdots\times (n+k-1).

2.\mathrm{A}_n^m表示从n个元素种选出m个组成的排列数量,称为排列数,\mathrm{A}_n^m=\frac{n!}{(n-m)!}.

3.\mathrm{C}_n^m{n \choose m}表示从n个元素种选出m个组成的子集数量,称为组合数,\mathrm{C}_n^m={n\choose m}=\frac{n!}{m!(n-m)!}.

4. 下降阶乘幂n^{\underline k}n可以是任意实数,当我们将组合数{r\choose k}定义改为{r\choose k}=\frac{r^{\underline k}}{k!}时,称其为二项式系数,其中上指标可以为任意实数,下指标仍为整数,当下指标k<0时,二项式系数的值为0.

计数原理和计数方法#

计数原理#

1. 加法原理:如果完成一件事情有n类方法,且第i类方法有a_i种方案,则完成这件事情共有\sum a_i种方案。

2. 乘法原理:如果完成一件事情有n个步骤,且第i个步骤有a_i种方案,则完成这件事情共有\prod a_i种方案。

计数方法#

1. 相邻元素捆绑法

例:现有7人站成一排,其中甲乙相邻且丙丁相邻,共有多少种不同的排法?

将甲乙两元素捆绑成整体并看成一个复合元素,同时丙丁也看成一个复合元素,再与其它元素进行排列. 因此方案数为\mathrm{A}_5^5\times \mathrm{A}_2^2\times \mathrm{A}_2^2=480种.

2. 不相邻元素插空法

例:现有4A球,2B球,3C球,把它们排成一排,所有A球不能相邻,且所有的球都是可分辨的,求有多少种排法?

先把B,C球排好,此时出现了6个间隙,把A球插入这些间隙即可. 因此方案数为\mathrm{A}_5^5\times \mathrm{A}_6^4=43200种.

3. 相同元素隔板法

例:把10个完全相同的球放入7个盒子中,每个盒子至少放一个,求有多少种方案?

因为球是相同的,所以可以将球先随意地排成一行,此时球与球之间出现了9个间隙,插入6个板就可以做到把球分割为7个非空部分的效果. 因此方案数为{9 \choose 6}=84种.

重要的组合恒等式#

对称恒等式#

{n \choose k}={n\choose {n-k}}

对于n,k\in \Z,n\geq 0成立.

证明:根据定义阶乘展开即可.

吸收/提取恒等式#

{r \choose k}=\frac{r}{k}{r-1\choose k-1}

对于r\in \R,k\in \Zk\not = 0成立.

证明:\binom{r}{k}=\frac{r^{\underline{k}}}{k!}=\frac{r}{k}\times \frac{(r-1)^{\underline{k-1}}}{(k-1)!}=\frac{r}{k}\binom{r-1}{k-1}

加法/归纳恒等式#

{r \choose k}={r-1\choose k}+{r-1\choose k-1}

对于r\in \R,k \in \Z成立.

证明:

\binom{r-1}{k-1}+\binom{r-1}{k}=\frac{(r-1)^{\underline{k-1}}}{(k-1)!}+\frac{(r-1)^{\underline{k}}}{k!}\\ \ \\=\frac{k(r-1)^{\underline{k-1}}}{k!}+\frac{(r-k)(r-1)^{\underline{k-1}}}{k!}=\frac{r^{\underline{k}}}{k!}=\binom{r}{k}

相伴恒等式#

(r-k){r\choose k}=r{r-1\choose k},k{r\choose k}=(r-k+1){r\choose k-1}

对于r\in \R,k\in \Z成立.

证明:

(r-k)\binom{r}{k}=\frac{r!}{(r-k-1)!k!}=r\times \frac{(r-1)^{\underline{r-k-1}}}{(r-k-1)!}\\\ \\=r\binom{r-1}{r-k-1}=r\binom{r-1}{k} \\\ \\ k{r\choose k}=\frac{r^{\underline k}}{(k-1)!}=\frac{(r-k+1)r^{\underline{k-1}}}{(k-1)!}=(r-k+1){r\choose k-1}

上指标反转#

{r\choose k}=(-1)^{k}{r-k-1\choose k}

对于r\in \R,k \in \Z成立.

证明:

\binom{r}{k}=\frac{r^{\underline{k}}}{k!}\\ \ \\ =\frac{r\times (r-1) \times ... \times (r-k+1)}{k!}\\ \ \\ =\frac{(-1)^{k}\times (k-r-1)\times (k-r-2) \times ... \times (-r)}{k!}\\ \ \\ =(-1)^k\frac{(r-k-1)^{\underline{k}}}{k!}=(-1)^k\binom{r-k-1}{k}

三项式系数恒等式#

{r\choose m}{m\choose k}={r\choose k}{r-k\choose m-k}

对于r\in \R, m,k\in \Z成立.

证明:

\binom{r}{m}\binom{m}{k}=\frac{r!}{(r-m)!(m-k)!k!}=\binom{r-k}{m-k}\binom{r}{k}

上指标求和#

\sum_{i=m}^n{i\choose m}={n+1\choose m+1}

对于n,m\in \Z成立.

证明:

设有n+1个物品,标号为1\sim n+1,现在从中选取m+1个物品的方案数即为{n+1\choose m+1},同时等价于在n个物品每个物品后插入一个结束符,强选结束符并在结束符前选m个物品的方案数。

平行恒等式#

\sum_{i=0}^n\binom{m+i}{i}=\binom{m+n+1}{n}

对于n,m\in \Z成立。

证明:

\sum_{i=0}^n\binom{m+i}{i}=\sum_{i=0}^n\binom{m+i}{m}\\ \ \\ =\sum_{i=m}^{n+m}\binom{i}{m}=\binom{n+m+1}{m+1}=\binom{n+m+1}{n}

范德蒙德卷积/下指标卷积#

\sum_{k=0}^n\binom{r}{k}\binom{s}{n-k}=\binom{r+s}{n}

对于r,s\in \R , n\in \Z成立。

证明:

左边表示从r个男生中选k个人,从s个女生中选出n-k个人的方案数,求和即为在r+s个人中选n个人的方案数,可知:\sum_{k=0}^n\binom{r}{k}\binom{s}{n-k}=\binom{r+s}{n}

下指标点积#

\sum_{i=0}^{m}{n\choose i}{m\choose i}={n+m\choose m}

假设m<n,则对于n,m\in \Z成立.

证明:

\sum_{i=0}^{m}{n\choose i}{m\choose i}=\sum_{i=0}^{m}{n\choose i}{m\choose m-i}={n+m\choose m}

上指标卷积#

\sum_{i=0}^n{i\choose a}{n-i\choose b}={n+1\choose a+b+1}

对于n,a,b\in \Z成立.

证明:考虑左式的组合意义为将n个物品分为在左右两部分,左边选a个,右边选b个的方案数,同时等价于插入一个分隔符,共n+1个物品选a+b+1个的方案数.

  • 上指标求和和上指标卷积同样存在非组合意义的直接证明方式,而范德蒙德卷积存在生成函数的证明方式,这保证了它们的绝对正确性.

二项式定理相关#

二项式定理#

根据二项式定理,组合数可以作为二项式高次幂展开式的系数:

(x+y)^n=\sum_{i=0}^{n}{n\choose i}x^iy^{n-i}

该式被称作二项式定理.

证明:

根据数学归纳法,该式在n=1时显然成立,那么假设其在n=p-1(p\geq 2)时也成立,则有:

(x+y)^p=(x+y)^{p-1}(x+y)=(x+y)\sum_{i=0}^{p-1}{p-1\choose i}x^iy^{p-1-i} \\ \ \\ =\sum_{i=0}^{p-1}{p-1\choose i}x^{i+1}y^{p-1-i}+\sum_{i=0}^{p-1}{p-1\choose i} x^iy^{p-i} \\ \ \\ =\sum_{i=1}^p{p-1\choose i-1}x^iy^{p-i}+\sum_{i=0}^{p-1}{p-1\choose i}x^iy^{p-i} \\ \ \\ =\sum_{i=0}^p\left( {p-1\choose i-1}+{p-1\choose i}\right)x^i y^{p-i}=\sum_{i=0}^p{p\choose i}x^iy^{p-i}

可知对于n=p,该式也成立,故对于所有n\in \N^+,定理都成立.

二项式定理的推广#

由于二项式系数的上指标可以是任意实数,所以二项式定理也有推广形式:

(x+y)^{\alpha}=\sum_{i=0}^{\infty}{\alpha \choose i}x^{i}y^{\alpha -i}

其中\alpha \in \R,称为广义二项式定理.

  • 事实上,我们还需考虑右式的收敛性,不过在应用中完全不需要理会这点.

对于阶乘幂,二项式定理仍成立:

(x+y)^{\underline n}=\sum_{i=0}^n{n\choose i}x^{\underline i}y^{\underline {n-i}} \\ \ \\ (x+y)^{\overline n}=\sum_{i=0}^n{n\choose i}x^{\overline i}y^{\overline {n-i}}

证明略.

二项式定理的直接推论#

1. \sum_{i=0}^n {n\choose i}=(1+1)^n=2^n

2. \sum_{i=0}^n{n\choose i}[2|i]=\sum_{i=1}^n{n\choose i}[2\not | i]=2^{n-1}

证明:

首先n个数中选奇数个数和选偶数的数的方案肯定是一样的.那么考虑选偶数个数的方案:单独考虑最后一个数,若选,则还需在n-1个数中选奇数个数,若不选,则还需选偶数个数,问题转回到推论一,答案即为2^{n-1}.

3. \sum_{i=0}^n(-1)^i{n\choose i}=(1-1)^n=[n=0]

多项式定理#

定义多项式系数\binom{n_1+n_2+\cdots+n_k}{n_1,n_2,\cdots,n_k}=\frac{(n_1+n_2+\cdots+n_k)!}{n_1!n_2!\cdots n_k!}

则有如下的多项式定理成立:

\left(\sum_{i=1}^kx_i\right)^n=\sum_{\sum_{i=1}^{k}n_i=n}\binom{n_1+n_2+\cdots+n_k}{n_1,n_2,\cdots,n_k}\prod_{i=1}^kx_i^{n_i}

证明可以直接从组合角度考虑.

模域组合数的计算#

预处理杨辉三角的方法#

杨辉三角是二项式系数在三角形中的一种几何排列,由中国数学家杨辉提出. 形式化地,杨辉三角可以表示成如下的下三角矩阵:

\left[ \begin{matrix} {0\choose 0} & 0 & 0 & 0 & \cdots\\ {1\choose 0} & {1\choose 1} & 0 & 0 & \cdots \\ {2\choose 0} & {2\choose 1} & {2\choose 2} & 0 & \cdots \\ {3\choose 0} & {3\choose 1} & {3\choose 2} & {3\choose 3} & \cdots \\ \vdots & \vdots & \vdots & \vdots & \ddots \end{matrix} \right]

其中A_{i,j}表示杨辉三角的第i行第j个数,有A_{i,j}={i\choose j}. 杨辉三角满足A_{i,j}=A_{i-1,j}+A_{i-1,j-1},本质上是组合数的加法恒等式.

那么我们可以根据加法恒等式预处理一张n^2大小的杨辉三角形的表,O(1)回答组合数。

对模数没有任何要求,时间复杂度O(n^2)-O(1).

Copy
#include <bits/stdc++.h> using namespace std; const int N = 5020; int C[N][N],n,Mod; inline int inc(int a,int b) { return a + b >= Mod ? a + b - Mod : a + b; } inline void Init(void) { C[0][0] = C[1][0] = C[1][1] = 1; for (int i = 2; i <= n; i++) { C[i][0] = C[i][i] = 1; for (int j = 1; j < i; j++) C[i][j] = inc( C[i-1][j] , C[i-1][j-1] ); } }

预处理阶乘的方法#

计算模意义下的组合式最常用的方法就是根据组合数的阶乘展开式计算。我们可以O(n)预处理阶乘,并用费马小定理求出最大数值阶乘的逆元,倒序更新所有阶乘的逆元,就可以实现O(1)回答组合数.

此时要求模数p为大于n,m的质数,换言之,1\sim \max(n,m)的阶乘在模p意义下均存在逆元时,该方法有效,时间复杂度O(n)-O(1).

Copy
#include <bits/stdc++.h> using namespace std; const int Mod = 1e9 + 7 , N = 1e6 + 20; inline int inc(int a,int b) { return a + b >= Mod ? a + b - Mod : a + b; } inline int dec(int a,int b) { return a - b < 0 ? a - b + Mod : a - b; } inline int mul(int a,int b) { return 1LL * a * b % Mod; } inline void Inc(int &a,int b) { return void( a = inc( a , b ) ); } inline void Dec(int &a,int b) { return void( a = dec( a , b ) ); } inline void Mul(int &a,int b) { return void( a = mul( a , b ) ); } inline int fastpow(int a,int b) { int res = 1; for (; b; Mul(a,a),b>>=1) if (b) Mul(res,a); return res; } inline int Inv(int x) { return fastpow( x , Mod - 2 ); } int inv[N],fac[N]; inline void Init(void) { inv[0] = fac[0] = 1; for (int i = 1; i <= N - 20; i++) fac[i] = mul( fac[i-1] , i ); inv[ N - 20 ] = Inv( fac[ N - 20 ] ); for (int i = N - 21; i >= 1; i--) inv[i] = mul( inv[i+1] , i+1 ); } inline int C(int n,int m) { return ( m > n || n < 0 || m < 0 ) ? 0 : mul( fac[n] , mul( inv[m] , inv[n-m] ) ); }

Lucas定理#

当模数p\leq\max(m,n-m)时,组合数分母的m!(n-m)!就不存在逆元,此时我们需要用到\mathrm{Lucas}定理:

{n\choose m}\equiv {n\bmod p\choose m\bmod p}\times {\left\lfloor\frac{n}{p}\right\rfloor\choose\left\lfloor\frac{m}{p}\right\rfloor}\pmod p

证明:

引理:(1+x)^p\equiv1+x^p\pmod p,p\in \mathrm{Prime}.

有费马小定理可知(1+x)^p\equiv1+x,又因为x\equiv x^p,可知(1+x)^p\equiv 1+x^p.

(1+x)^n\equiv(1+x)^{\left\lfloor\frac{n}{p}\right\rfloor p}(1+x)^{n\bmod p}\pmod p \\ \ \\ (1+x)^n\equiv (1+x^p)^{\left\lfloor\frac{n}{p}\right\rfloor}(1+x)^{n\bmod p}\pmod p

用二项式定理展开上式中的三个二项式的幂:

\sum_{i=0}^n{n\choose i}x^i\equiv\sum_{j=0}^{\left\lfloor\frac{n}{p}\right\rfloor}{\left\lfloor\frac{n}{p}\right\rfloor\choose j}(x^p)^{j} \times\sum_{k=0}^{n\bmod p}{n\bmod p\choose k}x^k

左式取到x^m项系数为{n\choose m},右式取到x^m项系数当且仅当j=\left\lfloor\frac{m}{p}\right\rfloor,k=m\bmod p,对应项系数同余,所以就有:

{n\choose m}\equiv {n\bmod p\choose m\bmod p}\times {\left\lfloor\frac{n}{p}\right\rfloor\choose\left\lfloor\frac{m}{p}\right\rfloor}\pmod p

  • 另一种理解,\mathrm{Lucas}定理的含义即为将组合数拆解为n,m按照p进制分解后每一位的组合数之积

回到上文,对于模数p较小时,只要p为质数,我们就可以运用\mathrm{Lucas}定理递归求解组合数,时间复杂度O(p)-O(\log_{p}n).

Copy
#include <bits/stdc++.h> using namespace std; const int N = 1e5 + 20; int inv[N],fac[N],n,m,Mod,T; inline int inc(int a,int b) { return a + b >= Mod ? a + b - Mod : a + b; } inline int dec(int a,int b) { return a - b < 0 ? a - b + Mod : a - b; } inline int mul(int a,int b) { return 1LL * a * b % Mod; } inline void Inc(int &a,int b) { return void( a = inc( a , b ) ); } inline void Dec(int &a,int b) { return void( a = dec( a , b ) ); } inline void Mul(int &a,int b) { return void( a = mul( a , b ) ); } inline int fastpow(int a,int b) { int res = 1; for (; b; Mul(a,a),b>>=1) if (b) Mul(res,a); return res; } inline int Inv(int x) { return fastpow( x , Mod - 2 ); } inline void Init(void) { inv[0] = fac[0] = 1; for (int i = 1; i <= Mod - 1; i++) fac[i] = mul( fac[i-1] , i ); inv[Mod-1] = Inv( fac[Mod-1] ); for (int i = Mod - 2; i >= 1; i--) inv[i] = mul( inv[i+1] , i+1 ); } inline int C(int n,int m) { return ( m > n || n < 0 || m < 0 ) ? 0 : mul( fac[n] , mul( inv[m] , inv[n-m] ) ); } inline int Lucas(int n,int m) { return m == 0 ? 1 : mul( C(n%Mod,m%Mod) , Lucas(n/Mod,m/Mod) ); } int main(void) { scanf( "%d" , &T ); while ( T --> 0 ) scanf( "%d%d%d" , &n , &m , &Mod ), Init() , printf( "%d\n" , Lucas(n+m,n) ); return 0; }

常见的组合问题#

组合数的单调性#

对于上指标确定的组合数,我们可以令f(x)={n\choose x}(n\in \N ^ +),则函数f是单峰函数,其极值在x=\lfloor \frac{n}{2} \rfloor处取到.

组合数函数图像拟合.png

图:用连续函数的图像近似离散函数的图像

阶乘幂反转#

两类阶乘幂可以提取因数-1进行互相转换:

x^{\underline{n}}=(-1)^n(x-n+1)^{\underline{n}},x^{\overline{n}}=(-1)^n(1-x-n)^{\overline{n}}

循环排列#

n个元素中选出m个排成圆圈的方案数,相当于线性排列时固定第一个数的方案。

一个循环排列可以对应m个线性排列,进而可以得到循环排列的计算公式:

\mathrm{Cir}_{n}^{m}=\frac{A_{n}^{m}}{m}=\frac{n!}{m\times (n-m)!}

组合数的数论性质#

p为质数,则对于n\in[1,p-1],有p\ |\ \binom{p}{n}

证明:

\because \binom{p}{n}=\frac{p\times (p-1)\times ... \times (p-n+1)}{n!}\in \Z\\ \ \\ \therefore n!\ |\ p\times (p-1) \times ... \times (p-n+1)\\ \ \\ \because(p,n)=1\\ \ \\ \therefore n!\ |\ (p-1) \times (p-1) \times ... \times (p-n+1)\\ \ \\ \therefore p\ |\ \binom{p}{n}

不定方程的解数问题#

1. 正整数解

求不定方程x_1+x_2+\cdots+x_k=n的正整数解的个数。

这个问题等价于把n个球放入k个盒子中,每个盒子中至少有1个球,由隔板法可知其方案数为\binom{n-1}{k-1}

2. 非负整数解

求不定方程x_1+x_2+\cdots+x_k=n的非负整数解的个数。

我们可以新增k个球,这样问题就等价于把n+k个球放入k个盒子中,每个盒子中至少有1个球,由隔板法可知其方案数为\binom{n+k-1}{k-1}

3. 下界限制

求不定方程x_1+x_2+\cdots+x_k=n的整数解的个数,满足x_1\geq a_1,x_2\geq a_2,\cdots,x_k\geq a_k

这个问题等价于不定方程x_1+x_2+\cdots+x_k=n-a_1-a_2-\cdots-a_k的非负整数解个数,可以其方案数为\binom{n+k-1-\sum_{i=1}^{n}a_i}{k-1}

4. 上下界限制

求不定方程x_1+x_2+\cdots+x_k=n的整数解的个数,满足a_1\leq x_1\leq b_1,a_1\leq x_2\leq b_2,\cdots,a_k\leq x_k\leq b_k

首先把限制转换为0\leq x_1\leq b_1-a_1,\cdots,0\leq x_k\leq b_k-a_k,运用容斥原理,答案即为:

\sum_{S\subseteq \{1,2,\cdots,k\}}(-1)^{|S|}\binom{n-1-\sum_{x\in S}(b_x-a_x)}{k-1}

多重集排列数#

多重集指含有重复元素的广义集合。设多重集S=\{n_1\times a_1,n_2\times a_2,\cdots,n_k\times a_k\}是由n_1a_1n_2a_2...n_ka_k组成的集合,则S的全排列个数为

\frac{\left (\sum_{i=1}^k n_i\right)!}{\prod_{i=1}^k\left (n_i!\right)}

证明:

对于朴素全排列,显然有\left (\sum_{i=1}^k n\right )!种方案,而在多重集的排列过程中,每个a_i出现了n_i次,在这n_i个位置间各个a_i可以互相调换位置,有n_i!中方案,故除去每一个n_i可以调换位置的重复方案即为总排列数.

多重集的组合数#

设多重集S=\{n_1\times a_1,n_2\times a_2,\cdots,n_k\times a_k\}是由n_1a_1n_2a_2...n_ka_k组成的集合,从中取出r\left(r\leq\sum_{i=1}^{k}n_i\right)个元素可以组成不同集合个数为:

\tbinom{k+r-1}{k-1}-\sum_{i=1}^n\tbinom{k+r-n_i-2}{k-1}+\sum_{1\leq i\leq j\leq n}\tbinom{k+r-n_i-n_j-3}{k-1}-\cdots+(-1)^k\tbinom{k+r \sum_{i=1}^k n_i- k-1}{k-1}

证明:

首先考虑r\leq\min\{n_i\}的情况,根据不定方程的非负整数解数量,可知答案为{k+r-1\choose k-1}.

然后可以考虑容斥原理,对于i,让选择a_i个数超出n_i成为一个性质,那么不具备任何性质的方案数即为上式.

高阶差分#

定义离散函数的差分算子(\Delta a)_i=a_i-a_{i-1},则有:

(\Delta^{n}a)_i=\sum_{j=0}^n(-1)^j{n\choose j}a_{i-j}

证明:

容易在算子间定义四则运算,此处不再赘述.

定义平移算子(\mathrm{E}a)_i=a_{i-1},恒等算子(\mathrm{I}a)_i=a_i,那么就有\Delta =\mathrm{I-E}.

根据二项式定理展开:

\Delta^n=(\mathrm{I-E})^n=(-1)^n\sum_{j=0}^n{n\choose j}\mathrm{E}^j(-\mathrm{I})^{n-j}

取第i项就可以得到:

(\Delta^{n}a)_i=(-1)^n\sum_{j=0}^n(-1)^{n-j}{n\choose j}a_{i-j} =\sum_{j=0}^n(-1)^j{n\choose j}a_{i-j}

可以用多项式卷积算法求高阶差分序列的前n项.

下指标求和(HDU6333)#

对于组合数的下指标求和,即:

\sum_{i=0}^m{n\choose i}

没有很好的封闭形式解,但是对于多组(n,m)的询问,我们可以将n,m看作一个区间的左右端点,使用O(\max\{n_i,m_i\}\sqrt q)的莫队算法来求解.

考虑转移,对于m\rightarrow m+1,只需加上一个组合数{n\choose m+1}即可. 对于n\rightarrow n+1,我们可以考虑用加法公式进行拆解:

\sum_{i=0}^m{n+1\choose i}=\sum_{i=0}^m\left({n\choose i}+{n\choose i-1}\right)=\sum_{i=0}^m{n\choose i}+\sum_{i=0}^{m-1}{n\choose i} \\ \ \\ =2\sum_{i=0}^m{n\choose i}-{n\choose m}

于是区间移动可以O(1)处理了.

自然数幂和#

自然数幂和指的是这一类求和问题:

\mathrm{S}_k(n)=\sum_{i=1}^ni^k

对于k比较小的情况,可以用组合恒等式推出通项公式.

k=1,\mathrm S_1(n)=\frac{n\times (n+1)}{2}

k=2,\mathrm S_2(n)=\sum_{i=1}^ni+2\sum_{i=1}^n{i\choose 2}=\frac{n\times (n+1)\times (2n+1)}{6}

k=3,\mathrm S_3(n)=\sum_{i=1}^ni+6\sum_{i=1}^n{i+1\choose 3}=\frac{n^2\times (n+1)^2}{4}

  • 不难发现,k次多项式的求和式都可以表示为k+1次多项式.

对于k任意的情况,我们很难直接推出通项公式,但是可以通过多项式插值技巧求出答案,我们会在下文讨论这个问题.

组合原理#

鸽巢原理#

普通鸽巢原理#

鸽巢原理又称抽屉原理,形式化表述如下:

  • q_1,q_2,q_3,\cdots,q_n是正整数,如果将\sum q_i-n+1个物品放入n个盒子中,记第i个盒子里放了a_i个物品,则总存在一个盒子j,满足a_j\geq q_j.

证明:

反证法,若不存在这样的盒子j,则对于任意的i都有a_i<q_i,那么\sum a_i\leq \sum(q_i-1)<\sum q_i -n+1,与总球数为\sum q_i - n + 1矛盾.

应用1:每十三个人中,总存在两人出生在同一个月.

证明:显然.

应用2:对于序列a_{1\sim n},总存在区间[l,r]使得n|\sum_{i=l}^ra_i .

证明:记其前缀和为数组s_{0\sim n},共有n+1个元素,所以必定存在i,j满足s_i\equiv s_j\pmod n,于是令l=i-1,r=j即可.

平均值原理#

对于n个变量x_1,x_2,\cdots,x_n,总满足:

\min_{i=1}^n\{a_i\}\leq\frac{\sum_{i=1}^na_i}{n}\ ,\ \max_{i=1}^n\{a_i\}\geq\frac{\sum_{i=1}^na_i}{n}

证明:反证法,导出矛盾.

Ramsey定理#

对于正整数n,m,总存在确定的上界x,满足对\mathrm{K}_x中所有边随意黑白染色,其中要么包含黑色\mathrm{K}_n,要么包含白色\mathrm{K}_m. 可以记x=\mathrm{R}(n,m),称为\mathrm{Ramsey}数.

证明略.

实例:\mathrm{R}(3,3)=6. 可以考虑第一个点的五条边,根据鸽巢原理,总存在三条边同色,那么三条同色边连接的三个点要么构成同色\mathrm{K}_3,要么与第一个点构成另一种同色\mathrm{K}_3.

\mathrm{Ramsey}定理在高维情况下仍然成立,即:

\mathrm{R}(a_1,a_2,\cdots,a_n)<\infty

反演原理#

反演的实质#

对于形如下的式子,我们称左右两式互为反演式:

f_i=\sum_{j=1}^iA_{i,j}g_j\Leftrightarrow g_i=\sum_{j=1}^iB_{i,j}f_j\tag 0

我们可以把f,g看作只有一行的矩阵,于是反演原理本质上就是矩阵乘法求逆:

f=g\times A\Leftrightarrow g=f\times B

  • 我们还可以发现A,B都是下三角矩阵.

不过矩阵乘法并没有什么用,我们可以根据反演式倒推反演成立的充要条件. 方法其实很简单,我们可以将右式的表达式带入到左式里面,如果最后化简得到了恒等式,那就说明右式可以推导得到左式.

同理,我们再把左式带到右式里面,然后化简得到恒等式,才能说明反演成立.

那么我们来实操一下:

f_i=\sum_{j=1}^iA_{i,j}\sum_{k=1}^jB_{j,k}f_k \\ \ \\ f_i=\sum_{k=1}^if_k\left(\sum_{j=k}^iA_{i,j}B_{j,k}\right)=\sum_{k=1}^if_k[k=i]

于是就有了右边推左边的条件:

\sum_{j=k}^iA_{i,j}B_{j,k}=[k=i]\tag{1}

同理把左边代入右边:

g_i=\sum_{j=1}^iB_{i,j}\sum_{k=1}^j A_{j,k}g_k \\ \ \\ g_i=\sum_{k=1}^ig_k\left(\sum_{j=k}^iB_{i,j}A_{j,k}\right)=\sum_{k=1}^ig_k[k=i]

那么左边推右边的条件就是:

\sum_{j=k}^iB_{i,j}A_{j,k}=[k=i]\tag{2}

真正的反演原理:(1)(2)两式同时成立,则有反演式(0)成立.

对称矩阵的反演#

f_i=\sum_{j=1}^iA_{i,j}g_j\Leftrightarrow g_i=\sum_{j=1}^iB_{i,j}f_j \\ \ \\ f_i=\sum_{j=i}^nA_{j,i}g_j\Leftrightarrow g_i=\sum_{j=i}^nB_{j,i}f_j

推导可知,上述两个反演式的代数充要条件均为:

\sum_{j=k}^iA_{i,j}B_{j,k}=[k=i]\land\sum_{j=k}^iA_{i,j}B_{j,k}=[k=i]

于是两个反演式等价.

反演系数转移#

f_i=\sum_{j=1}^is_jA_{i,j}g_j\Leftrightarrow g_i=\sum_{j=1}^i B_{i,j} f_j

对于形如上式的带权反演,我们可以合并系数,将权值转移到右式.

f_i=\sum_{j=1}^iA_{i,j}G_j\Leftrightarrow \frac{G_i}{s_i}=\sum_{j=1}^i B_{i,j} f_j \\ \ \\ f_i=\sum_{j=1}^iA_{i,j}G_j\Leftrightarrow G_i=\sum_{j=1}^i s_iB_{i,j} f_j

常规等价反演#

根据对称矩阵反演和反演系数转移,可以得知以下四种反演是等价的反演:

f_i=\sum_{j=1}^i(-1)^{j}A_{i,j}g_j\Leftrightarrow g_i=\sum_{j=1}^i (-1)^{j}B_{i,j} f_j \\ \ \\ f_i=\sum_{j=1}^iA_{i,j}g_j\Leftrightarrow g_i=\sum_{j=1}^i (-1)^{i+j}B_{i,j} f_j \\ \ \\ f_i=\sum_{j=i}^n(-1)^jA_{j,i}g_j\Leftrightarrow g_i=\sum_{j=i}^n(-1)^jB_{j,i}f_j \\ \ \\ f_i=\sum_{j=i}^nA_{j,i}g_j\Leftrightarrow g_i=\sum_{j=i}^n(-1)^{i+j}B_{j,i}f_j

  • 当然反演可以是乘法形式的,仍然存在类似上式的等价形式.

容斥原理#

补集转化#

补集转化又称为减法原理,若集合S被划分成了两部分A,\overline{A},则A对象的数目为|A|=|S|-|\overline{A}|.

基本容斥原理#

我们假设有全集S,以及n个集合,每个集合A_i中的元素具有性质P_i.

现在我们要求不具有任何性质的集合大小,则有如下的计算公式:

\left |\bigcap_{i=1}^n\overline{A_i}\right|=|S|+\sum_{T\subseteq\{1,2,...,n\},T\not =\emptyset}(-1)^{|T|}\left | \bigcap_{i\in T}A_i \right |

移项一下就可以得到另一种等价形式:

\left | \bigcup_{i=1}^nA_i \right |=\sum_{T\subseteq \{1,2,...,n\}}(-1)^{|T|-1}\left | \bigcap_{i\in T} A_i \right |

两种形式的容斥原理都具有组合意义:

形式1:不具备任何性质的元素个数 = 元素总个数 - 至少具备一个性质的元素个数之和 + 至少具备两个性质的元素个数之和 - 至少具备三个性质的元素个数之和 ...

形式2:所有集合的并集大小 = 所有集合的大小之和 - 每两个集合之间的交集大小 + 每三个集合之间的交集大小 ...

以下提供一种形式2的证明:

考虑元素x被包含在k个集合中,则它在|T|=t,t \leq k的时候被计算了\binom{k}{t}次.

设其总共被计算了P次,构造f(x)=(1-x)^k,根据二项式定理展开得到:

f(x)=\sum_{i=0}^k\binom{k}{i}x^{k-i}(-1)^{i}

P=\binom{k}{1}-\binom{k}{2}+\binom{k}{3}-\cdots+(-1)^{k-1}\binom{k}{k}

观察发现f(1)=1-P,于是得出P=1.

应用1:欧拉函数\varphi(n)的表达式为n\times\prod (1-\frac{1}{p_i}).

证明:设S_i代表质因数p_i1\sim n内所有倍数代表的集合,则\varphi(n)=n-\left | \bigcup _{i=1}^kS_i \right |,应用容斥原理,可得\varphi (n)=n-\sum_{T\subseteq P}(-1)^{|T|-1}\frac{n}{\prod_{i\in T}p_i},提取n,因式分解即可.

应用2:错位排列D_n的通项公式为n!+\sum_{i=1}^n(-1)^{i}\binom{n}{i}(n-i)!.

证明:令一个数字排在其原本的位置代表方案具有一个性质,套用容斥原理形式一即可.

应用3:第二类斯特林数\begin{Bmatrix}n\\m\end{Bmatrix}的表达式为\frac{1}{m!}\sum_{i=0}^{m}(-1)^i\tbinom{m}{i}(m-i)^n.

证明:令一个盒子为空代表具有一个性质,套用容斥原理形式一,除掉盒子标号即可.

应用4:多重集组合数.

证明:公式在常见的组合问题一节中已经给出,把超额使用一类元素看组一个性质,用隔板法计算答案,套用容斥原理形式一即可.

广义容斥原理#

fg为定义在指标集上的函数,则有如下等价关系:

f(S)=\sum_{T\subseteq S}g(T)\Leftrightarrow g(S)=\sum_{T\subseteq S}(-1)^{|S|-|T|}f(T)

证明:

首先右式代入左式,交换求和号:

f(S)=\sum_{P\subseteq S}f(P)\sum_{P\subseteq T\subseteq S}(-1)^{|T|-|P|} \\ \ \\ =\sum_{P\subseteq S}f(P)\sum_{i=0}^{|S|-|P|}(-1)^i\binom{|S|-|P|}{i} \\ \ \\ =\sum_{P\subseteq S}f(P)[|S|=|P|]=f(S)

最后一步使用了二项式定理的推论3.

右式代入左式的证明过程相似,故定理成立.

快速Mobius变换#

在广义容斥原理的式子中,我们可能需要求解一个数组的高位前缀和,也就是子集和,直接枚举子集是O(3^n)的,存在时间复杂度更低的算法.

我们可以考虑对一个集合S的子集贡献从高位到低位进行分类:首先是不包含最高位1子集的贡献,这其实是一个子问题;其次,包含最高位1的子集贡献我们再分为两类,不包含次高位1的子集贡献,这又是一个子问题;剩下同时包含最高位和次高位1的子集我们再类似地向下分类.

FMT贡献图.png

我们可以画出如上的贡献图. 以111为例,我们想知道它的子集和,首先可以考虑它的最高位1要不要,如果不要,那么可以直接把011的子集和累加给它,也就是最后一个粉丝箭头. 接着考虑要的情况,我们再看次高位的1要不要,如果不要,那么可以直接把101的子集和累加给它. 同样,最高两位都要的话,可以假设第三位不要,然后把110的子集和累加给它. 最后就是三位全都要了,显然他自己对自己也是有贡献的.

当然我们想要把011101110的子集和累加给111时,首先得保证它们的子集和已经求好了. 此时最好的方式就是直接按照图中箭头从上到下的顺序一层一层的枚举累加,这样就可以保证跨层询问子集和的时候一定已经完成累加了.

此时求和算法的时间复杂度类似于分治,有T(n)=2T(\frac{n}{2})+\frac{n}{2}. 容易得知T(n)=O(n\log_2 n)n=2^m时,时间复杂度就可以写成O(m\times 2^m)m是元素个数.

还原算法我们称之为逆\mathrm{Mobius}变换,只需把贡献扣掉就好了.

Copy
// t = 1 --> FMT , t = -1 --> IFMT inline void FMT(int *a, int n, int t) { for (int i = 1; i < 1 << n; i <<= 1) // i : the length of contribution arrow for (int p = i << 1 , j = 0; j < 1 << n; j += p) // p : the length of section , j : the number of position for (int k = 0; k < i; k++) a[i+j+k] += t * a[j+k]; // k : go through the section and add contribution }

二项式反演#

f(S)=F(|S|)g(S)=G(|S|),套用广义容斥原理:

F(|S|)=\sum_{T\subseteq S}G(|S|)\Leftrightarrow G(|S|)=\sum_{T\subseteq S}(-1)^{|S|-|T|}F(|T|) \\ \ \\ F(|S|)=\sum_{i=0}^{|S|}\binom{|S|}{i}G(i)\Leftrightarrow G(|S|)=\sum_{i=0}^{|S|}(-1)^{|S|-i}\binom{|S|}{i}F(i)

可以把|S||T|直接看成整数,得到:

f(x)=\sum_{i=0}^{x}{x \choose i}g(i)\Leftrightarrow g(x)=\sum_{i=0}^{x}(-1)^{x-i}\binom{x}{i}f(i)

我们称这个反演式为二项式反演.

根据反演原理,我们还可以得到另外三种等价形式,其中最常用的是这种:

f(x)=\sum_{i=x}^{n}\binom{i}{x}g(i)\Leftrightarrow g(x)=\sum_{i=x}^{n}(-1)^{x-i}\binom{i}{x}f(i)

二项式反演的重要运用是至少和恰好型方案数的转换.

首先,我们设\alpha(k)代表所有至少满足k的性质的方案数之和.

\alpha(k)=\sum_{T\subseteq\{1,2,...,n\},|T|=k}\left | \bigcap_{i\in T}A_i \right |

我们发现\alpha(k)将具有p(p\geq k)个性质的元素计算了\binom{p}{k}次.

假设\beta(k)代表恰好具有k个元素的方案数,则有递推公式如下:

\beta(k)=\alpha(k)-\sum_{i=k+1}^n\binom{i}{k}\beta(i) \\ \ \\ \alpha(k)=\sum_{i=k}^n\binom{i}{k}\beta(i)

二项式反演,可以得到\beta(k)的计算式:

\beta(k)=\sum_{i=k}^n(-1)^{i-k}\binom{i}{k}\alpha(i)

应用1:推导错位排列D_n的通项公式.

f_i代表恰好i个位置错排的方案数,则可以进行二项式反演:

n!=\sum_{i=0}^n\binom{n}{i}f_i

应用2:推导第二类斯特林数\begin{Bmatrix}n\\m\end{Bmatrix}的表达式

假设盒子有标号,设f_i代表恰好i个盒子非空的方案数,则可以二项式反演,答案除掉盒子标号即可:

m^n=\sum_{i=0}^m\binom{m}{i}f_i

应用3:球染色问题:有n个球排成一行,你有k种颜色,要求给每一个球染色,相邻两个球颜色不可以相同,并且每种颜色至少使用一次,求方案数.

假设f_i代表恰好使用i种颜色的方案数,则可以二项式反演:

k(k-1)^{n-1}=\sum_{i=0}^{k}{k \choose i}f_i

Min-Max容斥#

首先我们把一个整数n看成一个集合S(n)=\{1,2,\cdots,n\},那么:

\min_{i=1}^n\{a_i\}=\left| \bigcap_{i=1}^nS(a_i) \right|\ ,\ \max_{i=1}^n\{a_i\}=\left| \bigcup_{i=1}^nS(a_i) \right|

可以用容斥原理改写\max的表达式:

\max_{i=1}^n\{a_i\}=\left|\bigcup_{i=1}^nS(a_i)\right| =\sum_{T\subseteq \{1,2,\cdots ,n\}}(-1)^{|T|-1}\left| \bigcap_{i\in T} S(a_i) \right|

于是就可以得到:

\max_{i=1}^n\{a_i\}=\sum_{T\subseteq \{1,2,\cdots ,n\}}(-1)^{|T|-1}\min_{i\in T}\{a_i\}

\min\max反过来该式也成立,在期望意义下该式也成立.

Kth Min-Max容斥#

我们可以套用一般\min-\max容斥的式子猜想一个k大值容斥的形式:

\mathrm{Kth}\max_{i=1}^n\{a_i\}=\sum_{T\subseteq \{1,2,\cdots,n\}}f(|T|)\min_{i\in T}\{a_i\}

其中f(|T|)是容斥系数,具体是多少还不知道.

x+1大的元素显然会被统计到\sum_{i=0} ^x {x\choose i} f(i+1)次,我们可以直接令[x+1=k]=\sum_{i=1}^x {x \choose i}f(i+1),于是就可以二项式反演,得到:

f(x+1)=\sum_{i=0}^x (-1)^{x-i} {x \choose i}[i+1=k]

化简得到容斥系数f(x)=(-1)^{x-k}{x-1 \choose k-1}.

高维Min-Max容斥#

定义多元组的\min算符为:\min((x_1,x_2,\cdots,x_n),(y_1,y_2,\cdots,y_n))=(\min(x_1,y_1),\min(x_2,y_2),\cdots,\min(x_n,y_n)).

可以证明,原来的\min-\max容斥在高维情况下也成立.

n=\prod_{i=1}^kp_i^{a_i},每个正整数的代表元素组为(a_1,a_2,\cdots,a_k),那么该意义下的高维\min-\max容斥就等价于:

\mathrm{gcd}_{i=1}^n\{a_i\}=\prod_{T\subseteq \{1,2,\cdots ,n\}}\mathrm{lcm}_{i\in T}^{(-1)^{|T|-1}}\{a_i\}

Epilogue#

第一篇总结现已施工完毕,如有错误请提出.

posted @   Parsnip  阅读(4406)  评论(5)    收藏  举报
编辑推荐:
· 从零实现富文本编辑器#3-基于Delta的线性数据结构模型
· 记一次 .NET某旅行社酒店管理系统 卡死分析
· 长文讲解 MCP 和案例实战
· Hangfire Redis 实现秒级定时任务,使用 CQRS 实现动态执行代码
· Android编译时动态插入代码原理与实践
阅读排行:
· 一天 Star 破万的开源项目「GitHub 热点速览」
· 瞧瞧别人家的日期处理,那叫一个优雅!
· 使用TypeScript开发微信小程序(云开发)-入门篇
· 没几个人需要了解的JDK知识,我却花了3天时间研究
· 定时任务稳定性解决方案-healthchecks监控系统
点击右上角即可分享
微信分享提示
目录