组合数取模(转载)
转载来自https://blog.csdn.net/arrowlll/article/details/52629448
概述
首先我们要知道什么是组合数。具体可以参考我之前的博客 “排列与组合”笔记 中,集合的组合的部分。
这里复述如下: 令r为非负整数。我们把n个元素的集合S的r-组合理解为从S的n个元素中对r个元素的无序选择。换句话说,S的一个r-组合是S的一个子集,该子集由S的n个元素中的r个组成,即S的一个r-元素子集。
由此,求解组合数即变成了求式子C(n, r) 的值。
法一:Pascal公式打表
由Pascal公式(参考 组合数学笔记之二——二项式系数),我们知道
取二维数组 tC[][] ,初始化 tC[0][0] = 1; 打表即可。代码最简单,如下:
1 const int maxn(1005), mod(100003); 2 int tC[maxn][maxn]; //tC 表示 table of C 3 4 inline int C(int n, int k) 5 { 6 if(k > n) return 0; 7 return tC[n][k]; 8 } 9 10 void calcC(int n) 11 { 12 for(int i = 0; i < n; i++) 13 { 14 tC[i][0] = 1; 15 for(int j = 1; j < i; j++) 16 tC[i][j] = (C(i - 1, j - 1) + C(i - 1, j)) % mod; 17 tC[i][i] = 1; 18 } 19 }
计算 C(n,k)C(n,k) 返回内联函数C(n,k)C(n,k) 的值即可。
当然我们知道 C(n,k)=C(n,n−k)C(n,k)=C(n,n−k) ,所以上面的代码有很多空间和时间的浪费。可以将 tC[][] 二维数组转化为一维数组存储,同时,当 j>i/2j>i/2 时终止第二层循环,新代码如下
1 const int maxn(10005), mod(100003); 2 int tC[maxn * maxn]; //tC 表示 table of C 3 4 inline int loc(int n, int k) // C(n, k)返回在一维数组中的位置 5 { 6 int locate = (1 + (n >> 1)) * (n >> 1); // (n >> 1) 等价于 (n / 2) 7 locate += k; 8 locate += (n & 1) ? (n + 1) >> 1 : 0; // (n & 1) 判断n是否为奇数 9 return locate; 10 } 11 12 inline int C(int n, int k) 13 { 14 if(k > n) return 0; 15 k = min(n - k, k); 16 return tC[loc(n, k)]; 17 } 18 19 void calcC(int n) 20 { 21 for(int i = 0; i < n; i++) 22 { 23 tC[loc(i, 0)] = 1; 24 for(int j = 1, e = i >> 1; j <= e; j++) 25 tC[loc(i, j)] = C(i - 1, j) + C(i - 1, j - 1); 26 } 27 }
同样,要得到 C(n,k)C(n,k) 只需要返回内联函数C(n,k)C(n,k) 的值即可。
显然,由于空间的限制,pascal打表的方式并不适合求取一些比较大的组合数。例如,我们现在要求取的组合数的 nn 的范围是 [1,1000000][1,1000000] , 那么我们应该怎么办呢? 那就轮到方法二大显身手了。
法二:逆元求取组合数
由定理可知:如果用C(n, r)表示n-元素集的r-组合的个数,有
而我们的目标就是计算 C(n,r)%modC(n,r)%mod 的值。
由数论的知识我们知道,模运算的加法,减法,乘法和四则运算类似,即:
模运算与基本四则运算有些相似,但是除法例外。其规则如下:
- (a + b) % p = (a % p + b % p) % p
- (a - b) % p = (a % p - b % p) % p
- (a * b) % p = (a % p * b % p) % p
但对于除法却不成立,即(a / b) % p ≠≠ (a % p / b % p) % p 。
显然数学家们是不能忍受这种局面的,他们扔出了“逆元”来解决这个问题。那么什么是逆元? 逆元和模运算中的除法又有说明关系呢?
首先给出数论中的解释:
对于正整数 aa 和 pp,如果有 ax≡1(modp)ax≡1(modp),那么把这个同余方程中 xx 的最小正整数解叫做 aa 模 pp 的逆元。
什么意思呢? 就是指,如果 ax%p=1ax%p=1 , 那么x的最小正整数解就是 aa 的逆元。
现在我们来解决模运算的除法问题。假设
同时存在另一个数 xx 满足
由模运算对乘法成立,两边同时乘以 bb ,得到:
如果 aa 和 bb 均小于模数 pp 的话,上式可以改写为:
等式两边再同时乘以 xx, 得到:
因此可以得到:
哎,x是b的逆元呀(x 在模运算的乘法中等同于 1b1b, 这就是逆元的意义)
由以上过程我们看到,求取 (ab%p)(ab%p) 等同于 求取 (a∗(b的逆元)%p)(a∗(b的逆元)%p) 。 因此,求模运算的除法问题就转化为就一个数的逆元问题了。
而求取一个数的逆元,有两种方法
拓展欧几里得算法
费马小定理
对于利用拓展欧几里得算法求逆元,很显然,如果bx%p=1bx%p=1,那么 bx+py=1bx+py=1, 直接利用 exgcd(b, p, x, y)
(代码实现在后面给出),则 (x%p+p)%p(x%p+p)%p 即为 bb 的逆元。
对于第二种方法,因为在算法竞赛中模数p总是质数,所以可以利用费马小定理 :
可以直接得到 bb 的逆元是 bp−2bp−2 , 使用 快速幂 求解即可。
明白了以上几个关键点,那么求取组合数 C(n,r)C(n,r) 的算法就呼之欲出了:
- 求取1到n的阶乘对 mod 取模的结果存入数组 JC[] 中;
- 求取 C(n,r)C(n,r) 时, 先利用“拓展欧几里得算法”或者“费马小定理+快速幂”求 JC[r]的逆元存入临时变量 x1x1 ;
- 然后计算JC[n]∗x1%modJC[n]∗x1%mod 存入临时变量 x2x2;(x2x2 即为n!r!%modn!r!%mod 的值)
- 求取JC[n - r] 的逆元存入临时变量 x3x3;
- 则可以得到 C(n,r)=x2∗x3%modC(n,r)=x2∗x3%mod
下面是方法二的代码片段:
typedef long long LL; const LL maxn(1000005), mod(1e9 + 7); LL Jc[maxn]; void calJc() //求maxn以内的数的阶乘 { Jc[0] = Jc[1] = 1; for(LL i = 2; i < maxn; i++) Jc[i] = Jc[i - 1] * i % mod; } /* //拓展欧几里得算法求逆元 void exgcd(LL a, LL b, LL &x, LL &y) //拓展欧几里得算法 { if(!b) x = 1, y = 0; else { exgcd(b, a % b, y, x); y -= x * (a / b); } } LL niYuan(LL a, LL b) //求a对b取模的逆元 { LL x, y; exgcd(a, b, x, y); return (x + b) % b; } */ //费马小定理求逆元 LL pow(LL a, LL n, LL p) //快速幂 a^n % p { LL ans = 1; while(n) { if(n & 1) ans = ans * a % p; a = a * a % p; n >>= 1; } return ans; } LL niYuan(LL a, LL b) //费马小定理求逆元 { return pow(a, b - 2, b); } LL C(LL a, LL b) //计算C(a, b) { return Jc[a] * niYuan(Jc[b], mod) % mod * niYuan(Jc[a - b], mod) % mod; }
以上即为逆元求取组合数的方法,无论使用拓展欧几里得还是费马小定理,一开始求取Jc数组是的复杂度是 O(n)O(n),拓展欧几里得算法和费马小定理的复杂度均为 O(lg(mod))O(lg(mod)) , 如果要求取m次组合数,则总的时间复杂度为 O(mnlg(mod))O(mnlg(mod)).