组合数学
阅读前须知
本博客包含了一些提高到省选难度的组合数学知识点,主要由知识点和笔者做题时遇到的一些题组成。
对于知识点,阅读前需要你掌握最基础的一些组合数学知识,如排列数组合数,插板法等等,还需要一定的推式子能力,其中还会涉及到一部分与多项式和生成函数有关的内容,读者可以自行选择阅读。同时由于笔者能力有限,更高级的多项式和生成函数知识无法涉及到,若想学习可以从网上搜集学习。
题目上笔者也对题目进行了简单分类,读者完全可以只看自己学了的知识点所对应的题目。由于笔者水平有限,题目难度可能不高,还请大家谅解。
同时这篇博客也会在笔者学过更高深的内容后,进行知识上和题目上的不定期的更新。
若有笔误可随时在评论区给笔者指出,谢谢大家。
组合数学知识点
Lucas 定理
当 \(p\) 为质数时,有 \(\binom{n}{m} \equiv\binom{n/p}{m/p}\times\binom{n\;mod\;p}{m\;mod\;p}\pmod{p}\)
基础组合数公式
定义式: \(\binom{n}{m}=\frac{n!}{m!\times(n-m)!}\)
二项式定理: \((a+b)^n=\sum_{i=0}^{n}\binom{n}{i}a^{n-i}b^i\)
\(\binom{n}{m}=\binom{n}{n-m}\) ,取补集即可
\(\binom{n}{k}=\frac{n}{k}\binom{n-1}{k-1}\) ,根据定义式直接展开即可
\(\binom{n}{m}=\binom{n-1}{m}+\binom{n-1}{m-1}\) ,常见递推式,分别考虑选不选第 \(m\) 个得到
\(\sum_{i=0}^n\binom{n}{i}=2^n\) ,二项式定理取 \(a=b=1\) 时的特殊情况,也可以理解为任意选择
\(\sum_{i=0}^{n}\binom{n-m}{i-m}=2^{n-m}\) ,上式变形。
\(\sum_{i=0}^{n}\binom{n}{i}(-1)^i=\sum_{i=0}^{n}\binom{n}{i}(-1)^{n-i}=[n=0]\) ,二项式定理取 \(a=1,b=-1\) 的特殊情况,只有当 \(n=0\) 时答案为 \(1\) 。
\(\sum_{i=0}^{n}\binom{n}{i}\binom{m}{m-i}=\binom{n+m}{m}\) \((n\ge m)\)
\(\sum_{i=0}^{n}\binom{n}{i}^2=\binom{2n}{n}\) ,上一条取 \(n=m\) 的特殊情况
\(\sum_{i=0}^{n}i\binom{n}{i}=n\times2^{n-1}\)
考虑对于 \(F(x)=(1+x)^n=\sum_{i=0}^{n}\binom{n}{i}x^i\) ,两边同时求导得 \(n(1+x)^{n-1}=\sum_{i=1}^{n}\binom{n}{i}ix^{i-1}\) ,取 \(x=1\) 时可得
\(\sum_{i=0}^{n}\binom{i}{m}=\binom{n+1}{m+1}\) ,上指标求和公式,不断递推即可得到
\(\sum_{i=0}^{n}\binom{m+i}{m}=\binom{m+n+1}{m}\) ,平行求和公式,与上指标求和证明类似
\(\binom{n}{m}\binom{m}{k}=\binom{n}{k}\binom{n-k}{m-k}\) ,定义式直接化简可得
范德蒙德卷积: \(\sum_{i=0}^{k}\binom{r}{i}\binom{s}{k-i}=\binom{r+s}{k}\) ,证明如下:
由于对应项系数相等,所以 \(\sum_{i=0}^{k}\binom{r}{i}\binom{s}{k-i}=\binom{r+s}{k}\) ,得证。
二项式反演
常用形式一
设 \(f_n\) 表示恰好 \(n\) 个元素形成特定结构的方案数,\(g_n\) 表示从 \(n\) 个元素中选出 \(i\ge 0\) 个元素形成特定结构的方案数,根据定义我们得到 \(g_n=\sum_{i=0}^{n}\binom{n}{i}f_i\) 。若我们已知 \(g_n\) ,要求解 \(f_i\) ,有反演公式 \(f_n=\sum_{i=0}^{n}\binom{n}{i}(-1)^{n-i}g_i\) 。代数推导证明如下(大式子警告!)
我们设 \(k=i-j\) ,则
证毕。
其实也有更简单的证法,我们利用 \(EGF\) 。
我们考虑其实际意义,\(g_n\) 表示至多 \(n\) 个的方案数,\(f_n\) 表示恰好 \(n\) 个的方案数。
\(g_n=\sum_{i=0}^{n}\binom{n}{i}f_i\) \(f_n=\sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}g_i\)
常用形式二
\(g_k\) 表示至少 \(k\) 个的方案数,\(f_k\) 表示恰好 \(k\) 个的方案数。
\(g_k=\sum_{i=k}^{n}\binom{i}{k}f_i\) \(f_k=\sum_{i=k}^{n}(-1)^{i-k}\binom{i}{k}g_i\) (证明与形式一类似,此处省略)
多重集排列数
共有 \(n\) 个球,有 \(k\) 种,每种球有 \(a_i\) 个,则所有球的全排列数为 \(\frac{n!}{\prod_{i=1}^{k}a_i!}\) 。
卡特兰数
卡特兰数常见求解式子,默认 \(C_0=C_1=1\) 。
进栈序列为 \(1\) 到 \(n\) ,求出栈序列数 \(n\) 个节点的二叉树数量
长度为 \(2n\) 个括号序列数 凸 \(n+2\) 边形三角剖分数
以上答案均为卡特兰数第 \(n\) 项 \(C_n\) 。
斯特林数
第二类斯特林数
第二类斯特林数,又叫做斯特林子集数。\(n\brace m\) 表示将 \(n\) 个元素划分为 \(m\) 个互不相同的非空子集的方案数。
递推式:\({n\brace m}={{n-1}\brace{m-1}}+m{{n-1}\brace m}\) ,枚举将新元素放入一个新子集或放入之前的子集中得到。
通项公式:\({n\brace m}=\sum_{i=0}^{m}\frac{(-1)^{m-i}i^n}{i!(m-i)!}\) 。
证明:我们有 \(m^n=\sum_{i=0}^{m}{n\brace i}\times i!\times \binom{m}{i}\) 。(考虑其组合意义,左边表示 \(n\) 个不同球随意放进 \(m\) 个盒中的方案数,右边表示枚举非空盒子的数量 \(i\) 计算即可。)
显然我们考虑二项式反演,设 \(g_i=i^n\) ,\(f_i={n\brace i}i!\) ,有 \(g_m=\sum_{i=0}^{m}\binom{m}{i}f_i\) ,则
另一种写法 \({n\brace m}=\sum_{i=0}^{m}\frac{(-1)^i(m-i)^n}{i!(m-i)!}\) 。
所以我们得到了求同一行第二类斯特林数 \(n\brace i\) 的方法,直接按照递推式卷积一下即可,时间复杂度 \(O(n\log n)\) 。
根据上面我们还可以得到自然数幂求和的一个推导:
我们再从 \(EGF\) 的角度去研究第二类斯特林数,一个非空盒子装 \(i\) 个物品的方案数为 \([i>0]\) ,对应的 \(EGF\) 为 \(F(x)=\sum_{i=1}^{\infty}\frac{x^i}{i!}\) ,其封闭形式为 \(e^x-1\) ,所以 \(k\) 个无标号非空盒子装 \(i\) 个物品对应的 \(EGF\) 为 \(\frac{(e^x-1)^k}{k!}\) ,同时它也是同一列第二类斯特林数对应的 \(EGF\) ,即 \(\sum_{i=k}^{\infty}{i\brace k}\frac{x^i}{i!}=\frac{(e^x-1)^k}{k!}\) 。
第一类斯特林数
第一类斯特林数,又叫斯特林轮换数。\(n\brack m\) 表示将 \(n\) 个元素分为 \(m\) 个环的方案数(旋转前后相同的环视为一个环)
递推式: \({n\brack m}={{n-1}\brack{m-1}}+(n-1){{n-1}\brack m}\) ,枚举将新元素放入一个新环或插入一个旧环中得到。
性质: \(\sum_{i=1}^{n}{n\brack i}=n!\) ,每种排列对应每种置换。
上升幂与下降幂
下降幂 \(x^\underline n=\frac{x!}{(x-n)!}=\prod_{i=0}^{n-1}(x-i)\)
上升幂 \(x^\overline n=\prod_{i=0}^{n-1}(x+i)\)
普通幂转下降幂 \(x^n=\sum_{i=0}^{n}{n \brace i}x^\underline i\) ,下降幂转普通幂 \(x^\underline n=\sum_{i=0}^{n}{n\brack i}(-1)^{n-i}x^i\)
普通幂转上升幂 \(x^n=\sum_{i=0}^{n}{n \brace i}(-1)^{n-i}x^\overline i\) ,上升幂转普通幂 \(x^\overline n=\sum_{i=0}^{n}{n\brack i}x^i\)
现在证明第二个式子,我们利用归纳法
我们再证明第四个式子,利用第二个式子的结论,
斯特林反演
若 \(f_k=\sum_{i=0}^{k}{k\brace i}g_i\) ,则有 \(g_k=\sum_{i=0}^{k}(-1)^{k-i}{k\brack i}f_i\)
斯特林反演与二项式反演相比不太常用,可以只做了解。
组合计数
[NOIP2016 提高组] 组合数问题
题意:给定 \(n,m,k\) ,求对于所有的 \(0\le i\le n,0\le j\le min(i,m)\) 有多少对 \((i,j)\) 满足 \(k|\binom{i}{j}\) 。
\(n\le 2000\;\;m\le 2000\;\;k\le 21\)
直接 \(O(n^2)\) 递推预处理所有组合数模 \(k\) 意义下的值,然后设 \(f_{i,j}\) 表示 \(n=i,m=j\) 时对应的答案。考虑每拓展一次对答案的贡献,\(f_{i,j}=f_{i-1,j-1} +(f_{i-1,j}-f_{i-1,j-1})+(f_{i,j-1}-f_{i-1,j-1})=f_{i-1,j}+f_{i,j-1}-f_{i-1,j-1}\) ,同时判断 \(\binom{i}{j}\) 的值是否为 \(0\) ,若为 \(0\) 则 \(f_{i,j}++\) ,然后直接 \(dp\) 过去即可。时间复杂度 \(O(nm)\) 。
[SDOI2016] 排列计数
题意:求有多少种 \(1\) 到 \(n\) 的排列 \(p\) 满足有恰好 \(m\) 个位置 \(p_i=i\) 。答案对 \(10^9+7\) 取模。
\(n,m\le 10^6\;\;T\le 5\times 10^5\)
考虑钦定这 \(m\) 个位置,有 \(\binom{n}{m}\) 种情况。再考虑剩下的 \((n-m)\) 个位置,由于恰好 \(m\) 个位置满足 \(p_i=i\) ,所以剩下的这 \((n-m)\) 个位置为错排,直接递推错排数公式 \(f_i=(i-1)(f_{i-1}+f_{i-2})\) ,初始化 \(f_0=1,f_1=0\) 。最终答案为 \(\binom{n}{m}\times f_{n-m}\) 。时间复杂度为 \(O(n+T)\) 。
[NOI Online #2 入门组] 建设城市
有 \(2n\) 座建筑,每座建筑的高度为 \(1\) 到 \(m\) 之间的正整数,要求前 \(n\) 座高度单调不降,后 \(n\) 座高度单调不升,且第 \(x\) 座和第 \(y\) 座的高度相同,求方案数模 \(998244353\) 后的结果。
\(1\le n,m\le 10^5\;\;1\le x<y\le2*n\)
经典组合计数题,我们先分类讨论一下。
当 \(x\le n<y\) 时,我们枚举第 \(x\) 和第 \(y\) 座的高度 \(i\) ,此时序列会被分成 \(4\) 部分,以第一部分为例,它们高度区间为 \([1,i]\) ,编号区间为 \([1,x-1]\) 。即将 \(x-1\) 个相同的球放进 \(i\) 个盒子里的方案数,允许盒子为空,这就是经典的插板法了,易得答案为 \(\binom{x-1+i-1}{i-1}\) ,同理我们能求出其它部分的方案数,乘起来即可。
再考虑当 \(x<y\le n\) 或 \(n<x<y\) 时,我们可以将 \(x\) 到 \(y\) 之间看成一个建筑,这样序列就被分成了两个部分,还是按照上面的插板法计算即可。最终时间复杂度为 \(O(n+m)\) 。
[HAOI2011] Problem c
给 \(n\) 个人安排座位,每个人有一个编号 \(a_i\) (编号可以相同)。从第一个人开始依次入座,第 \(i\) 个人先尝试坐到 \(a_i\) ,如果 \(a_i\) 被占了,就尝试 \(a_i+1\) ,\(a_i+1\) 被占据了就尝试 \(a_i+2\) ,依次类推。如果一直尝试到第 \(n\) 个都不行,该安排方案就不合法。现在有 \(m\) 个人的编号已经确定,安排剩下的人的编号,求有多少种合法的安排方案,无解输出 NO,有解输出方案数对 \(mod\) 取模的结果。
\(T\le 10\;\;n\le 300\;\;0\le m\le n\;\; 2\le mod\le 10^9\)
先考虑无解的情况,我们设 \(sum_i\) 表示已经确定的人中编号 \(\ge i\) 的人数。枚举编号,若 \(sum_i>n-i+1\) ,说明一定有人尝试到第 \(n\) 个也没座位,此时无解。然后我们去考虑有解的方案数,我们考虑一个 \(dp\) ,设 \(f_{i,j}\) 表示剩余人数中编号 \(\ge i\) 的人中已经确定 \(j\) 个人的方案数,我们枚举一个 $k $ ,表示选择 \(k\) 人的编号为 \(i\) ,有转移 \(f_{i,j}=\sum _{k=0}^{j}f_{i+1,j-k}\times \binom{j}{k}\;(0\le j\le n-sum_i-i+1)\) ,最终答案为 \(f_{1,n-m}\) 。时间复杂度 \(O(Tn^3)\) 。
[SHOI2015] 超能粒子炮·改
求 \(\sum_{i=0}^{k}\binom{n}{i}\) 的值,对质数 \(p=2333\) 取模。
\(T\le 10^5\;\;n,k\le 10^{18}\)
我们设 \(f_{n,k}=\sum_{i=0}^{k}\binom{n}{i}\) ,大力化简。
直接递归求解即可,并且由于 \(p\) 只有 \(2333\) ,所以可以直接预处理 \(2333\) 以内的组合数以及 \(f\) 数组即可,对于 \(\binom{n/p}{k/p}\) 直接 \(lucas\) 定理计算即可。时间复杂度为 \(O(p^2+T\log_{p}^2n)\) 。
[CQOI2018] 交错序列
称一个 \(01\) 序列为交错序列,当且仅当序列中没有相邻的 \(1\) 。对于一个长度为 \(n\) 的交错序列,设 \(0\) 出现的次数为 \(x\) ,\(1\) 出现的次数为 \(y\) ,并给定非负整数 \(a,b\) ,则我们定义这个序列的特征值为 \(x^a\times y^b\) 。求长度为 \(n\) 的所有交错序列的特征值之和对质数 \(mod\) 取模的结果。
\(1\le n \le 10^7\;\;0\le a,b\le 45\;\;mod\le 10^8\)
我们考虑枚举序列中 \(1\) 的个数 \(i\) ,那么有 \(n-i\) 个 \(0\) ,考虑插板法。有 \(n-i+1\) 个空位,填入 \(i\) 个 \(1\) ,则方案数为 \(\binom{n-i+1}{i}\) ,同时根据 \(n-i+1\ge i\) 得到 \(i\le \lfloor\frac{n+1}{2}\rfloor\) ,所以答案为 \(\sum \limits_{i=0}^{\lfloor \frac{n+1}{2}\rfloor}\binom{n-i+1}{i}\times i^b\times (n-i)^a\) 。发现可以直接线性筛得到 \(i^a,i^b\) ,且 \(mod\) 为质数也可以通过求阶乘和阶乘的逆元求组合数。所以最终时间复杂度为 \(O(n)\) 。事实上这道题有更优秀的时间复杂度,这里不再介绍。
luogu P4981 父子
多次询问 \(n\) 个点的有根树种类对 \(10^9+9\) 取模后的结果。
\(T\le 10^4\;\;n\le 10^9\)
Prufer 序列
\(Prufer\) 序列可以用来解决一些无根树计数的问题。
树转化为 \(Prufer\) 序列:每次从树上选出一个编号最小的叶子节点,然后将与该叶子节点相邻的节点的编号写入 \(Prufer\) 序列的末尾,然后从树上删掉这个叶子节点,循环这个步骤直到只剩下两个节点。这个过程可以用一个 \(set\) 维护度数为 \(1\) 的节点实现。
一些性质:一个 \(n\) 个节点的树对应长度为 \(n-2\) 的 \(Prufer\) 序列,\(Prufer\) 序列中某个数出现的次数就等于这个数对应的节点在原无根树中的度数减一。
\(Cayley\) 公式:\(n\) 个节点的有标号无根树有 \(n^{n-2}\) 个。(根据 \(Prufer\) 序列易得)
推论:1. \(n\) 个节点的有标号有根树有 \(n\times n^{n-2}=n^{n-1}\) 个。
2. 已知 \(n\) 个节点的度数为 \(d_1,d_2\cdots d_n\) ,这样的无根树有 \(\frac{(n-2)!}{\prod_{i=1}^n(d_i-1)!}\) 个。
所以这道题答案为 \(n^{n-1}\) ,快速幂计算一下即可。时间复杂度为 \(O(T\log n)\) 。
[HNOI2004] 树的计数
一个 \(n\) 个节点的树,给定每个节点的度数 \(d_i\) ,问这样的树有多少种。
\(1\le n\le 150\) ,答案保证在 \(long\;long\) 范围内。
还是熟悉的 \(Prufer\) 序列。题意可以转化为:有 \(n-2\) 个位置,要放 \(n\) 个数,每个数占 \(d_i-1\) 个位置,问方案数。这就是一个简单的组合计数,\(ans=\prod_{i=1}^{n}\binom{sum}{d_i-1}\) ,其中 \(sum\) 表示剩余的位置数,预处理组合数即可。同时这个式子化简完就可以得到 \(\frac{(n-2)!}{\prod_{i=1}^n(d_i-1)!}\) ,但是这么算要写高精度,所以不如原始式子。时间复杂度 \(O(n^2)\) 。
CF785D Anton and School - 2
给定一个长度为 \(n\) 的只由小括号组成的括号序列,问有多少个长度为偶数的子序列,满足前半部分均为 '(',后半部分均为 ')' 。
\(1\le n\le 2\times10^5\)
考虑枚举满足条件的子序列中最后一个 '(' 的位置,假设它左边有 \(a\) 个 '(' (包括它自己),右边有 \(b\) 个 ')' ,那么它对答案的贡献为 \(\sum_{i=0}^{min(a-1,b-1)}\binom{a-1}{i}\binom{b}{i+1}\) ,此时时间复杂度为 \(O(n^2)\) ,考虑优化。发现这个东西有点像范德蒙德卷积:\(\sum_{i=0}^{k}\binom{a}{i}\binom{b}{k-i}=\binom{a+b}{k}\) ,所以我们转化一下。
当 \(min(a-1,b-1)=b-1\) 时,\(\sum_{i=0}^{b-1}\binom{a-1}{i}\binom{b}{b-i-1}=\binom{a+b-1}{b-1}=\binom{a+b-1}{a}\)
当 \(min(a-1,b-1)=a-1\) 时,\(\sum_{i=0}^{a-1}\binom{a-1}{a-1-i}\binom{b}{i+1}=\sum_{i=0}^{a}\binom{a-1}{a-1-i}\binom{b}{i+1}=\binom{a+b-1}{a}\)
综上所述,对答案贡献为 \(\binom{a+b-1}{a}\) ,可以 \(O(n)\) 预处理,单次 \(O(1)\) 计算。时间复杂度为 \(O(n)\) 。
luogu P7481 梦现时刻
设 \(f_{a,b}=\sum_{i=0}^{b}\binom{b}{i}\binom{n-i}{a}\) ,求 \(⨁\limits_{i=1}^{m}⨁\limits_{j=1}^{m}f_{i,j}\,mod\,998244353\) 的值。
\(1\le n\le 10^9\;\;1\le m\le 5000\)
非常巧妙的一道推式子题,发现异或无法利用性质,故我们只能考虑递推出所有的 \(f\) 值。
我们为了和题目的式子对应,我们将后面两个 \(\sum\) 各补上一个 \(i=0\) 的情况,我们会惊奇地发现:
至此我们可以递推求出所有的 \(f\) ,然后我们考虑边界。发现 \(f_{0,x}=\sum_{i=0}^{x}\binom{x}{i}=2^x\) ,\(f_{x,0}=\binom{n}{x}=\frac{n!}{(n-x)!x!}\) ,均可以 \(O(m)\) 预处理出来,然后递推求答案即可。时间复杂度 \(O(m^2)\) 。
容斥原理/二项式反演
错排数
我们设 \(f_n\) 表示恰好有 \(n\) 个位置错开,\(g_n\) 表示最多 \(n\) 个位置错开。易知 \(g_n\) 为全部的排列,即 \(g_n=n!\) ,直接二项式反演得到 \(f_n=\sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}g_i=\sum_{i=0}^{n}(-1)^{n-i}\binom{n}{i}i!\) 。
[HAOI2008] 硬币购物
题意:有 \(4\) 种硬币面值分别为 \(c_1,c_2,c_3,c_4\) 。共有 \(T\) 组询问,每次询问给定 \(lim_1,lim_2,lim_3,lim_4,tot\) ,询问在第 \(i\) 种硬币数量不大于 \(lim_i\) 的前提下凑出总价值为 \(tot\) 的方案数。
\(1\le T\le 1000\;\;1\le c_i, lim_i,tot\le 10^5\)
非常巧妙的一道题。考虑先做一个完全背包预处理出没有任何限制时凑出价值为 \(i\) 的方案数 \(f_i\) 。对于四个限制,我们可以考虑经典容斥,没有限制减去一个限制加上两个限制减去三个限制再加上四个限制。以一个限制为例,我们需要减去使用超过 \(lim_i\) 个 \(c_i\) 的方案数,那我们可以强制先用 \((lim_i+1)\) 个 \(c_i\) ,设剩下的价值为 \(p\),那么 \(f_p\) 都是不满足限制的,需要减去,剩下的情况同理计算即可。时间复杂度为 \(O(4n+16T)\) ,其中 \(n\) 表示 \(tot\) 的最大值。
[CSP-S2019] Emiya 家今天的饭
题意:有 \(n\) 种烹饪方法和 \(m\) 种食材,每道菜对应一种烹饪方法和一种食材,并且用第 \(i\) 种烹饪方法和第 \(j\) 种食材做出的菜种类数为 \(a_{i,j}\) 。求满足 1.至少做一道菜 2.每道菜的烹饪方法互不相同 3.每种食材最多在一半的菜中使用 的搭配方案数对 \(998244353\) 取模的结果。
\(1\le n\le 100\;\;1\le m\le 2000\)
很巧妙的一道计数 \(dp\) 。发现不符合食材限制的最多有一种,所以直接枚举这一种不符合的食材。所以考虑容斥,先计算总方案数,比较简单,设 \(s_i=\sum_{j=1}^{n}a_{i,j}\) ,再设 \(f_{i,j}\) 表示前 \(i\) 种菜中共选了 \(j\) 种食材的方案数,直接转移 \(f_{i,j}=f_{i-1,j}+s_i\times f_{i-1,j-1}\) ,总方案数为 \(\sum_{i=1}^{n}f_{n,i}\) 。然后考虑减去不符合限制的,假如当前枚举到不符合食材的是 \(p\) ,设 \(g_{i,j,k}\) 表示前 \(i\) 行选了 \(p\) 食材 \(j\) 次,其他食材 \(k\) 次的方案数,根据选不选 \(p\) 食材直接转移 \(g_{i,j,k}=g_{i-1,j,k}+a_{i,p}\times g_{i-1,j-1,k}+(s_i-a_{i,p})\times g_{i-1,j,k-1}\) ,但这样时间复杂度为 \(O(mn^3)\) ,考虑优化。发现 \(j,k\) 的具体值我们并不关心,只关心相对大小,所以我们设 \(g_{i,j}\) 表示前 \(i\) 行选了 \(p\) 食材次数减不选的次数为 \(j\) 的方案数,转移为 \(g_{i,j}=g_{i-1,j}+a_{i,p}\times g_{i-1,k-1}+(s_i-a_{i,p})\times g_{i-1,j+1}\) ,但是由于第二维可能是负的,所以我们直接同时加上 \(n\) ,最后统计 \(\sum_{i=1}^{n}g_{n,n+i}\) 就是要减去的情况。最终时间复杂度为 \(O(mn^2)\) 。
[HNOI2011] 卡农
在集合 \(S=\lbrace1,2,3,\cdots,n\rbrace\) 中选出 \(m\) 个无序子集,满足:(1) 所有的子集不能为空 (2) 不能存在两个完全相同的集合 (3) 在这 \(m\) 个子集中 \(1\) 到 \(n\) 每个元素出现的次数必须为偶数。求方案数对 \(10^8+7\) 取模的结果。
\(1\le n,m\le 10^6\)
神仙计数题目。考虑先转化一下题意,有 \(2^n-1\) 个数,分别为 \(1\) 到 \(2^n-1\) ,从中选 一个大小为 \(m\) 的无序子集,满足:(1) 这 \(m\) 个数均不相同 (2) 这 \(m\) 个数的异或和为 \(0\) ,求方案数。我们考虑 \(dp\) ,设 \(f_i\) 表示选了 \(i\) 个数时满足限制的有序集合的方案数。发现当我们确定 \(i-1\) 个数时,假设他们的异或和为 \(x\) ,那么我们第 \(i\) 个数就确定了为 \(x\) ,易知选前 \(i-1\) 个数的总方案数为 \(A_{2^n-1}^{i-1}\) 。发现有不合法的情况,所以我们考虑容斥,发现当 \(x=0\) 时显然是不合法的,也就是说,前 \(i-1\) 个数已经构成了一种合法方案,所以要减去 $f_{i-1} $ 。然后考虑减去有重复数字的,假设在前 \(i-1\) 个数中第 \(j\) 个数为 \(x\) ,我们将第 \(j\) 个数删去后剩下 \(i-2\) 个数构成一种合法方案,并且 \(x\) 有 \(2^n-1-(i-2)\) 种取值,且 \(j\) 有 \(i-1\) 种取值,所以不合法的方案有 \(f_{i-2}\times (i-1)\times (2^n-i+1)\) 种。最终总的转移式子为 \(f_i=A_{2^n-1}^{i-1}-f_{i-1}-f_{i-2}\times (i-1)\times (2^n-i+1)\) 。最终 \(f_m\) 得到的就是满足限制的有序集合方案数,由于题目要求无序,所以再除以 \(m!\) 即可。时间复杂度为 \(O(m+\log n)\) 。
[HAOI2018] 染色
给一个长度为 \(n\) 的序列 ,给每个位置染成 \(1\) 到 \(m\) 里的任意一种颜色。若有 \(k\) 种颜色恰好出现了 \(p\) 次,则会获得 \(w_k\) 的愉悦度。对于所有可能的染色方案,求愉悦度对 \(1004535809\) 取模后的结果。
\(1\le n\le 10^7\;\;m\le 10^5\;\;p\le 150\)
\(1004535809\) 为 \(NTT\) 模数,原根为 \(3\) 。
(常用 \(NTT\) 模数:\(469762049\) \(998244353\) \(1004535809\) ,其原根均为 \(3\) )
考虑设 \(f_i\) 表示恰好 \(i\) 种颜色出现 \(p\) 次的方案数,\(g_i\) 表示至少 \(i\) 种颜色出现 \(p\) 次的方案数。考虑求解 \(g\) 数组,先钦定有 \(i\) 种颜色出现 \(p\) 次,为 \(\binom{m}{i}\) 。此时还剩下 \(n-pi\) 个位置没有染色,把它们看成一个整体,考虑看成一个多重集全排列数,为 \(\frac{n!}{(p!)^i(n-pi)!}\) ,再考虑从剩余的 \(m-i\) 种颜色中任意选取填入 \((n-pi)\) 个空位中,为 \((m-i)^{n-pi}\) 。最终 \(g_i=\binom{m}{i}\frac{n!}{(p!)^i(n-pi)!}(m-i)^{n-pi}\) ,然后上二项式反演。以下 \(lim=min(m,\lfloor\frac{n}{p}\rfloor)\) ,
我们设 \(F(x)=\sum_{i=0}^{lim}\frac{(-1)^i}{i!}x^i\) ,\(G(x)=\sum_{i=0}^{lim}i!g_ix^i\) ,则 \(f_k=\frac{1}{k!}\sum_{i=k}^{lim}G_iF_{i-k}\) 。这是经典的差卷积形式,我们将 \(F\) 翻转得到 \(F_i={F^T}_{lim-i}\) ,则 \(f_k=\frac{1}{k!}\sum_{i=k}^{lim}{F^T}_{lim+k-i}G_i\) ,这样 \(lim+k-i=lim+k\) ,变成了常见的和卷积形式,此时也知道题目的模数用处何在了,直接 \(NTT\) 碾过去即可。时间复杂度为 \(O(m\log m)\) 。
[JSOI2011] 分特产
将 \(m\) 种物品分给 \(n\) 个同学,每种物品有 \(a_i\) 个。在每个同学至少分得一个物品的前提下,求方案数模 \(10^9+7\) 的结果。
\(1\le n,m\le 1000\;\;a_i\le 1000\)
我们设 \(f_i\) 表示恰好 \(i\) 个同学没有物品,所以我们求的就是 \(f_0\) 。恰好有点难求,考虑设 \(g_i\) 表示至少 \(i\) 个同学没有物品的方案数。那我们钦定 \(i\) 个同学没有物品,为 \(\binom{n}{i}\) ,考虑处理剩下 \(n-i\) 个同学。对于第 \(j\) 种物品,我们将其全部分给 \(n-i\) 个人,这是经典的插板法,方案数为 \(\binom{a_j+n-i-1}{n-i-1}\) ,最终得到 \(g_i=\binom{n}{i}\prod_{j=1}^{m}\binom{a_j+n-i-1}{n-i-1}\) ,最后直接上二项式反演得到 \(f_k=\sum_{i=k}^{n-1}(-1)^{i-k}\binom{i}{k}g_i\) ,所以 \(f_0=\sum_{i=0}^{n-1}(-1)^ig_i\) ,时间复杂度为 \(O(n^2)\) 。
[TJOI2019] 唱、跳、rap和篮球
有一个长度为 \(n\) 的数组,将其用 \(A,B,C,D\) 填充,不允许有空位置。现分别有 \(a,b,c,d\) 个 \(A,B,C,D\) ,求填充数组的方案数,使得不存在 \(pos\) 使得第 \(pos,pos+1,pos+2,pos+3\) 位依次为 \(A,B,C,D\) 。方案数对 \(998244353\) 取模。
\(n\le 1000\;\;a,b,c,d\le 500\)
设 \(f_i\) 表示恰好存在 \(i\) 个 \(pos\) 的方案数,我们要求的就是 \(f_0\) 。直接上二项式反演,设 \(g_i\) 表示至少存在 \(i\) 个 \(pos\) 的方案数,有 \(g_k=\sum_{i=k}^{lim}\binom{i}{k}f_i\) ,则 \(f_0=\sum_{i=0}^{lim}(-1)^ig_i\) 。现在考虑求解 \(g_i\) ,我们还是钦定 \(i\) 个 \(pos\) 剩下的位置随便排列。考虑计算其方案数,我们把那 \(i\) 个连续长度为 \(4\) 的位置缩成一个位置,这样就有 \(n-3i\) 个位置,从中选 \(n-4i\) 个不为 \(pos\) 的区间即可,故方案数为 \(\binom{n-3i}{n-4i}=\binom{n-3i}{i}\) 。然后考虑剩下的位置随意排列,现在我们分别有 \(a-i,b-i,c-i,d-i\) 个 \(A,B,C,D\) ,用它们填入 \(n-4i\) 个空位,求方案数。我们可以枚举 \(A,B,C,D\) 的数量,这样就是一个多重集排列数,所以方案数为 \(\sum_{p=0}^{a-i}\sum_{q=0}^{b-i}\sum_{s=0}^{c-i}\sum_{t=0}^{d-i} [p+q+s+t=n-4i]\frac{(n-4i)!}{p!q!s!t!}\) ,发现这又是一个卷积形式,直接 \(NTT\) 即可。还有另外一种利用 \(EGF\) 的方法,我们分别写出它们的 \(EGF\) ,以 \(A\) 为例,其对应的 \(EGF\) 为 \(\sum_{j=0}^{a-i}\frac{x^j}{j!}\) ,将四个 \(EGF\) 直接卷积得到 \(F(x)\) ,则 \([x^{n-4i}]F(x)\) 为答案。最终总时间复杂度为 \(O(n^2\log n)\) 。
ARC160D
求长度为 \(n\) ,总和为 \(m\) 的序列数,满足通过以下两种操作可以使它变成全 \(0\) 的序列。对 \(998244353\) 取模。
一:在序列中选一个元素使其值减去 \(k\) 二:在序列中选择连续 \(k\) 个位置,让每个位置上的数减去 \(1\)
\(1\le k\le n\le 2000\;\;1\le m\le 10^{18}\)
发现无解当且仅当 \(m\,mod\,k\ne 0\) 。我们考虑将这两种操作转化成一个操作序列 \(B\) ,它的长度为 \(2n+k-1\) ,对于 \(1\le i\le n\) ,\(B_i\) 表示对位置 \(i\) 进行操作一的次数;对于 \(n+1\le i\le 2n-k+1\) ,\(B_i\) 表示对以 \(i-n\) 开头的连续 \(k\) 个位置进行操作二的次数。同时序列 \(B\) 还要满足
第二个限制是限制每个区间加 \(1\) 的次数。我们将其限制为 \(<k\) ,这样每个原序列就能对应唯一一种操作序列。我们现在只需要对序列 \(B\) 进行计数。
这是一个带上界的插板法。经典容斥,我们钦定至少有 \(i\) 个不满足限制的即强制让它们取 \(k\) ,其余任意,那么剩下的和就是 \(\frac{m}{k}-ik\) ,直接插板法即可。最终得到
推式子综合
CF932E Team Work
求 \(\sum_{i=1}^{n}\binom{n}{i}\times i^k\) ,对 \(10^9+7\) 取模。
\(1\le k\le 5000\;\;1\le n\le 10^9\)
开始推式子。
发现当 \(i=0\) 时对答案没有贡献,所以直接改写
直接 \(O(k^2)\) 递推预处理斯特林数计算即可,时间复杂度为 \(O(k^2+k\log n)\) 。
[HEOI2016/TJOI2016]求和
给定 \(n\) ,求 \(\sum_{i=0}^{n}\sum_{j=0}^{i}{i\brace j}\times 2^j\times j!\) 的值,对 \(998244353\) 取模。
\(1\le n\le 10^5\)
开始推式子。
发现当 \(j>i\) 时对答案没有贡献,所以直接改写
\(\sum_{i=0}^{n}x^i\) 可以利用等比数列求和公式化简为 \(\frac{x^{n+1}-1}{x-1}\)
到这里就豁然开朗了,后面又是喜闻乐见的和卷积形式,直接 \(NTT\) 卷一下即可,时间复杂度为 \(O(n\log n)\) 。
[国家集训队] Crash 的文明世界
给定一颗 \(n\) 个点的树,定义点 \(u\) 的指标值为 \(\sum_{i=1}^{n}{dis_{u,i}}^k\) ,求每个点的指标值对 \(10007\) 取模的结果。
\(1\le n\le 5\times 10^4 \;\;1\le k\le 150\)
经典套路,先将 \(k\) 次方转化。
现在最主要的问题是如何求出 \(\sum_{i=1}^{n}\binom{dis_{u,i}}{j}\) ,利用组合数性质 \(\binom{dis_{u,i}}{j}=\binom{dis_{u,i}-1}{j}+\binom{dis_{u,i}-1}{j-1}\) ,我们想到可以通过树形 \(dp\) 求出。设 \(f_{u,j}\) 表示 \(u\) 的子树内 \(\binom{dis_{u,i}}{j}\) 的和,则 \(f_{u,j}=\sum_{v\in son_u}f_{v,j}+f_{v,j-1}\) ,此时能求出以某个点为根时的答案了,若求所有点的答案,直接上换根 \(dp\) 即可。时间复杂度为 \(O(nk)\) 。
CF1278F Cards
共有 \(m\) 张牌,其中一张为目标牌。现进行 \(n\) 次完全随机洗牌(即 \(m!\) 种排列等概率出现),每次洗完查看第一张牌是什么。设 \(x\) 为 \(n\) 次洗牌后第一张牌为目标牌的次数,求 \(x^k\) 的期望值,对 \(998244353\) 取模。
\(n,m\le 998244352\;\;k\le 5000\)
我们考虑枚举有多少次第一张牌为目标牌,然后大力推式子:
后面两项均可以 \(O(k)\) 预处理得到,可以 \(O(k^2)\) 全部预处理斯特林数,或 \(O(k\log k)\) 直接求同一行的斯特林数。时间复杂度为 \(O(k^2)\) 或 \(O(k\log k)\) 。
CF961G Partitions
有 \(n\) 个物品,每个物品有一个权值 \(w_i\) 。定义一个集合 \(S\) 的权值为 \(|S| \sum_{i\in S}w_i\) ,定义一种划分方案的权值和为划分出的所有集合的权值和。求将这 \(n\) 个物品划分为 \(k\) 个集合的所有方案的权值和,对 \(10^9+7\) 取模。
\(n,k\le 2\times 10^5\;\;w_i\le 10^9\)
我们先考虑从组合意义上去简单地做出这道题,我们发现权值的计算前面有系数 \(|S|\) ,我们考虑物品 \(j\) 对物品 \(i\) 的权值 \(w_i\) 的贡献,为 \(j\) 和 \(i\) 分到同一个集合的方案数。当 \(j=i\) 为 \({n\brace k}\) ,当 \(j\ne i\) 时为 \((n-1){{n-1}\brace k}\) ,最终得到 \(ans=\sum_{i=1}^{n}w_i({n\brace k}+(n-1){{n-1}\brace k})\) ,这样就可以直接利用通项公式求同一行第二类斯特林数,时间复杂度为 \(O(k\log k)\) 。
虽然组合意义足以解决此题,但组合意义明显晦涩难懂一点,而代数推导才是我们想要的理解容易,所以我们从代数推导上再次解决此题。
我们发现每个物品对答案的贡献是相同的,我们设为 \(tmp\) ,我们考虑枚举 \(i\) 所在集合的大小 \(s\) ,我们此时要再选 \(s-1\) 个元素,同时还要将剩下的 \(n-s\) 个物品放入 \(k-1\) 个集合中,所以有 \(tmp=\sum_{s=1}^{n}s\binom{n-1}{s-1}{{n-s}\brace{k-1}}\) (别忘了贡献要乘集合大小 \(s\) ),开始推式子:
第一个 \(\sum\) 已经化简的足够了,我们单独考虑第二个 \(\sum\) 。
我们有 \(m\binom{n}{m}=n\binom{n-1}{m-1}\) (直接把组合数拆阶乘形式可以得证),所以我们把它拆开,于是有:
这两个东西有没有勾起你的记忆,直接上二项式定理得:
最终 \(tmp=\sum_{i=0}^{k-1}\frac{(-1)^i(k-i)^{n-2}(k+n-i-1)}{i!(k-1-i)!}\) ,最后再乘上每个物品得权值即可。利用线性筛预处理 \(i^{n-2}\) 可将时间复杂度做到 \(O(k)\) 。
[省选联考 2020 A 卷] 组合数问题
给定一个 \(m\) 次多项式 \(F(x)=a_0+a_x+a_2x^2+\cdots+a_mx^m\) ,求
\(1\le n,x,p,a_i\le 10^9 \;\;m\le min(n,1000)\)
也许你已经直接开始推了,但你发现用以前的方法好像推不动,这道题我们用一点新科技:下降幂。
对于下降幂 \(m^{\underline k}=\frac{m!}{(m-k)!}\) ,它与组合数相乘: \(m^{\underline k}\binom{n}{m}=\frac{m!n!}{(m-k)!m!(n-m)!}=\frac{(n-k)!}{(m-k)!(n-m)!}\frac{n!}{(n-k)!}=\binom{n-k}{m-k}n^{\underline k}\) 。
那我们先将 \(F(x)=\sum_{i=0}^{m}a_ix^i\) 改写成下降幂形式 \(F(x)=\sum_{i=0}^{m}b_ix^{\underline i}\) ,再开始推式子:
后面这个组合数是不是一眼就有思路了,凑二项式定理!
现在我们要计算的只有 \(b_i\) 了,考虑普通幂转下降幂的等式:
所以 \(b_i=\sum_{j=i}^{m}a_j{j\brace i}\) ,直接 \(O(m^2)\) 递推第二类斯特林数即可。总时间复杂度为 \(O(m^2)\) 。