组合推导
总结了一些组合推式子的技巧
前置知识
式子推导的一个目的就是获取表达式的封闭形式或是更加易于运算的形式。
封闭形式:可以通过有限次的初等运算计算得到结果的表达式。
这里的初等运算是指如 \(+\quad-\quad\times\quad\div\quad\log\quad a^n\quad\sin\quad n!\) 等常见运算。微分,积分,极限不属于初等运算。
大概有个概念就行了,不必过分执着于细节上的定义。
组合数的括号记法:\(\displaystyle\binom{n}{k}\) 表示从 \(n\) 个数中选出 \(k\) 个数的方案数。有时候也会用 \(\displaystyle\binom{n}{k,n-k}\) 这样的记法。其中的数都在阶乘意义下,相当于 \(\displaystyle\frac{n!}{k!(n-k)!}\) 和 \(\displaystyle\binom{n}{k}\) 。
二项式系数:形如 \(\displaystyle\binom{n}{k}\) 的数被称为二项式系数。
文章中所用到的一些记号:
-
\(\mathrm{Identity}\):恒等式
-
\(\mathrm{Theorem}\):定理
-
\(\mathrm{Lemma}\):引理
-
\(\mathrm{Proof}\):证明开始
-
\(\mathrm{LHS}(\text{left hand side})\):等号左边的式子。
-
\(\mathrm{RHS}(\text{right hand side})\):等号右边的式子。
-
\(Q.E.D.\):证毕
参考资料:
- 《具体数学》
正文
二项式系数的定义:
\(\dbinom{n}{k}\) 其中 \(k\in \mathbb{N}, n\ge k\),对于不满足上述条件的不合法情况,均将其值视为 \(0\)。
给出几个基本的组合恒等式,它们是式子推导的基石:
\(\displaystyle\mathrm{Identity~1.1:}\binom{n}{k}=\binom{n}{n-k}\)(对称变换)
\(\displaystyle\mathrm{Identity~1.2:}\binom{n}{k}=\binom{n-1}{k-1}+\binom{n-1}{k}\) (递推公式)
\(\displaystyle\mathrm{Identity~1.3:}\binom{n}{m}\binom{m}{k}=\binom{n}{k}\binom{n-k}{m-k}\)(三项恒等式)
以上均可以用组合意义记忆。
\(\displaystyle\mathrm{Identity~1.4:}\binom{n}{k}=\frac{n}{k}\binom{n-1}{k-1}\)(吸收 / 释放公式)
这个公式可以吸收组合数前的讨厌的系数,后面会有具体的例子。
上面是一些基础恒等式,但是在式子推导中起到了巨大的作用。
在实际应用中,需要化简的式子往往以和式 \(\sum\) 的形式出现,于是化简的时候必然会用到一些和式相关的组合恒等式。
和式相关的组合恒等式:
\(\displaystyle\mathrm{Identity~1.5:}(x+y)^n=\sum_{k}{\binom{n}{k}x^ky^{n-k}}\)(二项式定理)
\(\displaystyle\mathrm{Identity~1.6:}\sum_{k=0}^{n}{\binom{n}{k}}=2^n\)(下指标求和)
\(\displaystyle\mathrm{Identity~1.7:}\sum_{k=0}^{n}{\binom{k}{m}}=\binom{n+1}{m+1}\)(上指标求和)
\(\displaystyle\mathrm{Identity~1.8:}\sum_{k=0}^{n}{\binom{m+k}{k}}=\binom{n+m+1}{n}\)(平行求和)
\(\displaystyle\mathrm{Identity~1.9:}\sum_{k}{\binom{r}{n-k}\binom{s}{m+k}}=\binom{r+s}{n+m}\)(范德蒙德卷积)
以上 \(5\) 个式子每一个都有非常好的组合意义来解释。
-
每个括号内都有两个颜色的球(红,蓝)可以选,选出 \(k\) 个球(\(x^k\))的方案数有 \(\dbinom{n}{k}\) 个。
-
每个数都有选或不选两种可能。
-
从 \(n+1\) 个球中选取 \(m+1\) 个球,固定选取的最后一个(第 \(m + 1\) 个)球的位置 \(k+1\),在前 \(k\) 个中选取 \(m\) 个球的方案数相加。
-
类比于 \(3\) 来记忆。
-
有两个盒子,一个盒子中有 \(r\) 个球,另一个中有 \(s\) 个球,一共从中选择 \(n+m\) 个球,总共的方案数就是枚举盒子 \(1\) 中选 \(n-k\) 个球,盒子 \(2\) 中选 \(m+k\) 个球。
弄清楚它们能解决哪些问题是很有必要的:比如范德蒙德卷积是唯一包含两个二项式系数的式子,真正应用的时候,求解包含两个二项式系数的和式大部都与范德蒙德卷积有关。
以上都可以被称为基础中的基础。
广义二项式系数
前文的二项式系数都被限定在了正整数范围内,这十分不利于式子的推导。
对于形如 \(\displaystyle\binom{n}{k}\) 的二项式系数,其中 \(n\) 可以被扩展到实数域上。
定义 \(\displaystyle\binom{n}{k}=\frac{n(n-1)(n-2)\dots (n-k+1)}{k!}, n\in \mathbb{R},k\in\mathbb{N}\) 。不难发现,\(n\) 为正整数的时候与普通二项式系数并无二至。
有了广义二项式系数这个有力工具,终于真正意义上可以开始我们的组合推导正文了。
开始之前,再介绍一个公式:
\(\displaystyle\mathrm{Identity~1.10:}\binom{n}{k}=(-1)^k\binom{k-n-1}{k}\)(上指标反转)
要证明的话,我也不会什么优美的办法,暴力展开吧。
一个比较优美的事实是上指标反转两次后,你就可以得到原式。
一些求解的技巧
和式求解的基本技巧:
分离系数:\(\sum\limits_{i}{c\times a_i}=c\times \sum\limits_{i}{a_i}\)
和式拆解:\(\sum\limits_{i}{b_i+a_i}=\sum\limits_{i}{a_i}+\sum\limits_{i}{b_i}\)
指标变换:\(\sum\limits_{i}{[0\le i\le n]a_i}=\sum\limits_{i}[0\le i\le n]a_{n-i}\)。
对于技巧三,乘法或是其它运算也有类似操作。
多重和式 \(\sum\sum\),有交换求和顺序的技巧:
常见的方法是 \(\displaystyle\sum_{i=0}^{n}\sum_{j=0}^{i}\to \sum_{j=0}^{n}\sum_{i=j}^{n}\) ,它的使用是基于将较为困难的内层和式进行转化求解。
例 \(1\)(二元和式的求解):
求出 \(\displaystyle\sum_{-q\le k\le l}{\binom{l-k}{r}\binom{q+k}{s}}\) 的简单封闭形式。
\(l,q,r,s\in \mathbb{Z}, l+q\ge 0, r\ge 0, s\ge 0\)
例 \(2\)(二项式系数商的一种处理方式):求出 \(\displaystyle\sum_{k=0}^{m}{\binom{m}{k}}/\binom{n}{k}\) 的简单封闭形式。
例 \(3\)(二项式定理的逆向运用):CF660E
给出题意得出的式子:
\(\displaystyle\sum_{i=1}^{n}\sum_{j=i}^{n}{\binom{j-1}{i-1}(m-1)^{j-i}m^{n-(j-i)}}\)
例 \(4\)(裂项求递推式):
\(\displaystyle Q_n=\sum_{k\le 2^n}{\binom{2^n-k}{k}}(-1)^k, n\in \mathbb{N^+}\)
对于看起来无法找到封闭形式的和式,可以考虑使用组合数的递推公式进行裂项求解。
小结
是时候该总结一下所遇到的一些问题了:
二项式系数边界问题:
\(\displaystyle\binom{1}{0}, \binom{0}{0}, \binom{0}{1}\) 分别等于几?\(0!, 0^0\) 又如何呢?这些问题也许看起来微不足道,但千里之堤溃于蚁穴,我们必须得注意。
- \(\displaystyle \binom{1}{0}=1, \binom{0}{0}=1, \binom{0}{1}=1\)
这是因为在二项式系数中,定义 \(0!=1\),代入定义式 \(\displaystyle\binom{n}{k}=\frac{n!}{k!(n-k)!}\) 就可以得到答案。
- \(0^0=1\)
为什么这么说呢 ? 许多人认为 \(0^0\) 没有意义,因为 \(\displaystyle\lim_{x\to 0}x^0\) 和 \(\displaystyle\lim_{x\to 0}0^x\) 是两个截然不同的值。然而在二项式系数下,却并非如此。
考虑二项式定理 \(\displaystyle(x+y)^n=\sum_{k=0}^{n}\binom{n}{k}x^{k}y^{n-k}\) 中 \(n=0\) 的情况。我们应当指定 \(0^0=1\),否则其并不成立。
恒等式的成立条件
这个是非常有必要研究的一个问题,推柿子的过程中,可能因为一些玄学错误而百思不得其解。这个时候就要考虑,你所用恒等式的成立条件了。
举个例子 \(\displaystyle\binom{n}{k}=\binom{n}{n-k}\) 仅在 \(n\) 为非负整数的时候成立,如果你在推导过程中用到了这个公式,一定要注意它的成立条件。
如下列举了上面所提到的所有恒等式的成立条件。
在上表中,你可以注意到平行求和法和上指标求和法的差异,二项式定理的精确成立条件。
可以感受到,没有任何成立条件限制的恒等式是最为有用且好用的(整数意义下)。
推导的过程
在推导的过程中难免会遇到一些和式上下界的变动,这时候,将其写为更加一般化的上下界,甚至如果允许不写上下界,更能简化你推导的难度和加快推导速度。
比如,\(\displaystyle\sum_{i=0}^{n}\) 显然比 \(\displaystyle\sum_{i=2}^{n-1}\) 能使运算更加简洁,而 \(\displaystyle\sum_{i}\) 又是一个更加泛化而简洁的形式。
所以如果条件允许的话,使用更加泛化的形式更有利于你的推导。
下面看一个复杂一点的例子。
例 \(5\):
求出 \(\displaystyle\sum_{k\ge 0}{\binom{n+k}{m+2k}}\binom{2k}{k}\frac{(-1)^k}{k+1}\) 的简单封闭形式。
递归式与和式的互相转化
对于形如 \(a_nT_n=b_nT_{n-1}+c_n\) 有一般方法将其转化为和式。
两侧分别乘以求和因子 \(s_n\),\(s_na_nT_n=s_nb_nT_{n-1}+s_nc_n\) 。
求和因子应满足 \(s_nb_n=s_{n-1}a_{n-1}\) 。
设 \(S_n=s_na_nT_n\),得到 \(S_n=S_{n-1}+s_nc_n\)
\(\displaystyle\to S_n=s_0a_0T_0+\sum_{i=1}^{n}{s_ic_i}\)
\(\displaystyle\to T_n=\frac{1}{s_na_n}(s_0a_0T_0+\sum_{i=1}^{n}{s_ic_i})\)
如何求出恰当的求和因子 \(s_n\) 又是一个问题。
对于式子:\(\displaystyle s_n=\frac{s_{n-1}a_{n-1}}{b_n}\),展开后可以得到:\(\displaystyle s_n=\frac{a_{n-1}a_{n-2}\dots a_1}{b_nb_{n-1}\dots b_{2}}\) 。
只要保证 \(b_i\) 不为 \(0\),就可以得到 \(s_n\) 的值。
如上提供了一种递归式化和式的通法。
例 \(6\):
求解如下递归式:
\(\frac{1}{2}\) 的处理
考虑如下等式 \(\displaystyle(r-\frac{1}{2})^{\underline{k}}r^{\underline{k}}= 2r^{\underline{2k}}\frac{1}{4^k}\)
两边同时除以 \((k!)^2\) 后可以导出如下公式:
于是对于形如 \((x+y)^{\frac{1}{2}}\) 二项式展开后的情形,\((2),(3)\) 给出了一种优美的处理方式。
如上两式还给出了系数如 \(4^{-n}\) 的一种处理办法。
比如下面这个例子:
还有一个非常优美的恒等式
例 \(7\)(加倍公式):\(\displaystyle\sum_{k}{\binom{2k}{k}\binom{2n-2k}{n-k}}\)
以上是二项式系数中 \(\displaystyle\frac{1}{2}\) 的处理办法,甚至,你可以将某些难以处理的二项式系数转换为含有 \(\displaystyle\frac{1}{2}\) 的形式进行处理。
例 \(8\)(综合考察):CF1278F
给出答案的式子 \(\displaystyle \sum_{i=0}^{n}{\binom{n}{i}p^i(1-p)^{n-i}i^k}\)
考虑化简:
化简到这里,已经可以用 \(O(k^2)\) 递推做掉这道题了。
还可以继续。
对 \(\mathrm{Lemma~1}\) 使用二项式反演得到:
继续刚才的推导。
考虑裂项求后面和式的递推式。
以下是 \(k\le n\) 的情况:
边界是 \(R_k=1\)
对于 \(n<k\) 的情况:\(R_i=(1-p)R_{i+1},R_n=1\)
综上所述:
高阶差分
一阶差分为:\(\Delta f(x)=f(x+1)-f(x)\)
二阶差分为:\(\Delta^2f(x)=\Delta f(x+1)-\Delta f(x)\)
\(n\) 阶差分为:\(\Delta^nf(x)=\Delta^{n-1}f(x+1)-\Delta^{n-1}f(x)\)
\(\displaystyle\mathrm{Theorem~2.1:}\Delta^nf(x)=\sum_{k}{\binom{n}{k}(-1)^{n-k}f(x+k)}\)
数学归纳法。
\(\mathrm{Proof:}\)
\(n=1\) 的时候该式显然成立。
假设该式在 \(n=m-1, m\ge 2, m\in \mathbb{Z}\) 的时候成立。
该定理很重要,它给出了原函数和差分函数之间的关系,也让我们看到了二项式系数出现的另外一种形式:交错排列的二项式系数。
牛顿级数:
对于一个多项式 \(\displaystyle f(x)=a_nx^n+a_{n-1}x^{n-1}\dots+a_1x+a_0\) 。一定可以被表示为 \(\displaystyle f(x)=c_n\binom{x}{n}+c_{n-1}\binom{x}{n-1}\dots+c_1\binom{x}{1}+c_0\)(考虑通常幂能转下降幂,下降幂转二项式系数)。
如上 \(f(x)\) 的展开式 \(\displaystyle c_n\binom{x}{n}+c_{n-1}\binom{x}{n-1}\dots+c_1\binom{x}{1}+c_0\) 就被称为牛顿级数。
设 \(\displaystyle F(x)=c_d\binom{x}{d}+c_{d-1}\binom{x}{d-1}\dots+c_1\binom{x}{1}+c_0\)
考虑 \(\displaystyle\Delta\left(\binom{x}{d}\right)=\binom{x}{d-1}\)(即递推公式)对上式就不会感到奇怪了。
考察 \(\Delta^nF(0)\) 可以发现一个非常有用的事实:\(\displaystyle\Delta^nF(0)=c_n,\forall n\in [0, d]\)
于是 \(F(x)\) 的牛顿级数又可以写作:\(\displaystyle F(x)=\Delta^dF(0)\binom{x}{d}+\Delta^{d-1}F(0)\binom{x}{d-1}\dots+\Delta F(0)\binom{x}{1}+F(0)\)
例如 \(F(x)=x^3\) 的牛顿级数就为 \(\displaystyle F(x)=6\binom{x}{3}+6\binom{x}{2}+1\binom{x}{1}+0\binom{x}{0}\)
对 \(\displaystyle\Delta^nF(0)=c_n\) 应用 \(\mathrm{Theorem~2.1}\) 可以得到如下式子:
\(\displaystyle\sum_{k}{\binom{n}{k}(-1)^{n-k}(c_0\binom{k}{0}+c_1\binom{k}{1}+c_2\binom{k}{2}+\dots)}=c_n\)
将括号中的式子转化为通常幂的形式后,由于 \(n!c_n=a_n\),于是上式可以化为如下形式:
\(\displaystyle\mathrm{Theorem~2.3:}\sum_{k}{\binom{n}{k}(-1)^k(a_0+a_1k+a_2k^2+\dots)}=n!a_n(-1)^n\)
例 \(8\):\(\displaystyle\sum_{k}{\binom{n}{k}\binom{r-sk}{n}(-1)^k}\)
\(k\) 前面的系数 \(s\) 看似十分困难,但是观察到 \(\displaystyle\binom{n}{k}(-1)^k\) 后,我们不难想到高阶差分。
于是一切就仿佛水到渠成般一样容易:
根据 \(\mathrm{Theorem~2.3}\) 得到原式 \(=n!a_n(-1)^n=s^n\) 。
非常的巧妙。
很神奇的一个事情是最后的答案根本与 \(r\) 无关,也许这有些不合常理,但是事实确实如此(正确性测试代码)。
我曾思考了很久,牛顿级数(高阶差分)能应用在哪些地方,多项式的展开?但是牛顿级数能做到的,泰勒展开也能做到。
牛顿级数(高阶差分)主要能在以下地方:
- 交错排列的二项式系数
就像上文的例 \(8\) 一样,\(\mathrm{Theory~2.3}\) 能将形如 \(\displaystyle\sum_{k}{(-1)^k\binom{n}{k}G(k)}\) 的式子,转换为求解 \(G(k)\) 的 \(k^n\) 的系数。
- 下降幂多项式
牛顿级数将下降幂多项式与离散的点值联系在了一起。
对 \(\displaystyle F(x)=\sum_{i=0}^{n}{F[i]\binom{x}{i}}\) 使用二项式反演可以得到:\(\displaystyle F[i]=\sum_{i=0}^{n}{(-1)^{n-i}\binom{x}{i}F(i)}\)
如上给出了离散点值与 \(F[i]\) 之间的联系,这是一种全新的插值方式。
二项式反演可以 \(NTT\) 加速,则时间复杂度为优秀的 \(O(n\log n)\) 。
有了与离散点值之间的联系,容易发现 \(\displaystyle \frac{x^{\underline{i}}}{i!}=\binom{x}{i}\),简单转换就是下降幂多项式了。
我还没写 QAQ,正确性不保证。
文章已至尾声,可是组合数的世界才刚刚展开。
欧拉数,调和级数,\(q-analog\),超几何函数 \(\dots\) 。它们不是偏僻的名词,它们潜藏于每一个角落。
组合数学的天地广阔无穷,等待你去探索。