Lucas定理初探

1.1 问题引入

已知\(p\)是一质数,求\(\dbinom{n}{m}\pmod{p}\).

关于组合数,它和排列数都是组合数学中的重要概念.这里会张贴有关这两个数的部分内容.

由于Lucas定理比较简单粗暴,这里直接给出表达式:

\[\boxed{\dbinom{n}{m}\equiv\dbinom{n\mod p}{m\mod p}\dbinom{\frac{n}{p}}{\frac{m}{p}}\pmod{p}}$$. 或者: $$\boxed{\dbinom{n}{m}\equiv \dbinom{n_1}{m_1}\dbinom{n_2}{m_2}\dots\dbinom{n_k}{m_k} \pmod{p}}\]

其中\(n=(n_1n_2\dots n_k)_p\),\(m=(m_1m_2\dots m_k)_p\),即\(n_i\)\(m_i\)都是\(n\),\(m\)\(p\)进制表示.

上面的公式其实是下面公式的递归版.仿照二进制,\(n \text{ div } p = (n_1n_2n_3\dots n_{k-1}n_k)_p \text{ div } p = (0n_1n_2\dots n_{k-1})_p\),相当于整个序列右移1位.而\(n \pmod{p}=n_k\),就是取出序列的最后一位.我们来证明一下这个定理.

我们把\(n\)的序列最后一项单独抠出来,\(n\)可以表示成\(n=\lfloor\frac{n}{p}\rfloor p + n\mod{p}=(n_1n_2\dots n_{k-1}0)_p+n_k\).

为了方便证明,我们把组合数套到二项式定理里面去.以下同余式均在模p意义下进行.

我们构造一个函数\(G_n(x)=(1+x)^n = \sum_{i=0}^n \dbinom{n}{i}x^i1^{n-i} = \sum_{i=0}^n \dbinom{n}{i}x^i\)
似乎这个函数和所谓的生成函数有关.

\(G_p(x)\equiv (1+x)^p \equiv \sum_{i=0}^p \dbinom{p}{i}x^i \equiv 1+ \sum_{i=1}^{p-1}\dbinom{p}{i}x^i + x^p\)
由于当\(i \neq 0 , p\)时,有\(\dbinom{p}{i} \equiv \dfrac{p!}{i!(p-i)!} \equiv p \dfrac{(p-1)!}{i!(p-i)!} \equiv 0\)
此时原式中间的那一大项式子可以直接消去,有:\((1+x)^p \equiv 1+x^p\).
由费马小定理,\((1+x)^p \equiv 1+x \pmod{p}\).

再结合上面的结论推到一下\(G_n(x)\)的表达式:
\(G_n(x)\equiv (1+x)^n \equiv (1+x)^{\lfloor\frac{n}{p}\rfloor p + n\pmod{p}}\)
\(\equiv (1+x)^{\lfloor\frac{n}{p}\rfloor}(1+x)^{n\pmod{p}}\)
\(\equiv (1+x^p)^{\lfloor\frac{n}{p}\rfloor}(1+x)^{n\pmod{p}}\)
\(\equiv \sum_{i=0}^{\lfloor\frac{n}{p}\rfloor}\dbinom{\lfloor\frac{n}{p}\rfloor}{i}(x^{p})^{i} \cdot \sum_{i=0}^{n\pmod{p}}\dbinom{n\pmod{p}}{i}x^i\)
\(\equiv G_{\lfloor\frac{n}{p}\rfloor}(x^p)\cdot G_{n\pmod{p}}(x)\)

其中函数\(G_s(x)\)中浓缩了一串数列:\(\{\dbinom{s}{0},\dbinom{s}{1},\dots,\dbinom{s}{s}\}\),每一项\(\dbinom{s}{i}\)是函数中\(x^i\)的系数.

因此,函数\(G_n(x)\)\(x^k\)的系数是\(\dbinom{n}{k}\),假设复合函数\(G_{\lfloor\frac{n}{p}\rfloor}(x^p)\cdot G_{n\pmod{p}}(x)\)中包含\(x^k\)的一项可以写成:
\(a_kx^k=\dbinom{\lfloor\frac{n}{p}\rfloor}{u}(x^{p})^{u}\dbinom{n\pmod{p}}{v}x^v=\dbinom{\lfloor\frac{n}{p}\rfloor}{u}\dbinom{n\pmod{p}}{v}x^{pu+v} \qquad (※)\)
则必然有\(pu+v=k\).
同样的,我们取\(u=\lfloor\frac{k}{p}\rfloor\),\(v=k\pmod{p}\)
带入\((※)\)式:\(a_kx^k=\dbinom{\lfloor\frac{n}{p}\rfloor}{\lfloor\frac{k}{p}\rfloor}\dbinom{n\pmod{p}}{k\pmod{p}}x^k\).
我们就得到了一个新的函数$$H_n(x)=G_{\lfloor\frac{n}{p}\rfloor}(x^p)\cdot G_{n\pmod{p}}(x)=\sum_{i=1}{n}\dbinom{\lfloor\frac{n}{p}\rfloor}{\lfloor\frac{i}{p}\rfloor}\dbinom{n\pmod{p}}{i\pmod{p}}xi$$.
由上面的推论,在模\(p\)意义下,\(H_n(x) \equiv G_n(x)\)恒成立,所以对于每一项\(x^m\),其系数均有:\(\dbinom{n}{m}\equiv \dbinom{\lfloor\frac{n}{p}\rfloor}{\lfloor\frac{m}{p}\rfloor}\dbinom{n\pmod{p}}{m\pmod{p}}\)

2.1 拓展

对于\(p\)不是质数的情况,我们可以对p进行质因数分解:\(p=\prod_{i=1}^{k}p_i^{c_i}\)

那么原问题就变成了求解\(x=\dbinom{n}{m}\mod{(\prod_{i=1}^{k}p_i^{c_i})}\)

注意到每个\(p_i^{c_i}\)都必定是两两互素的数,我们先求\(\dbinom{n}{m}\pmod{p_i^{c_i}}\),则原来的问题就变成了:$$\begin{cases}x\equiv \dbinom{n}{m} \pmod{p_1^{c_1}}\x\equiv \dbinom{n}{m} \pmod{p_2^{c_2}}\\cdots\x\equiv \dbinom{n}{m} \pmod{p_k^{c_k}}\end{cases}$$

我们的问题就变成了求解这个同余方程组。利用中国剩余定理,我们知道最后解的形式一定是\(x\equiv x_0 \pmod{(\prod_{i=1}^{k}p_i^{c_i})}\)。用中国剩余定理求出方程组的特解\(x_0\)就可以了。

如果求\(\dbinom{n}{m}\mod p_i^{c_i}\),可以直接用阶乘计算:
\(\dbinom{n}{m}\mod{p_i^{c_i}}=\dfrac{n!\mod p_i^{c_i}}{(m!\mod{p_i^{c_i}})((n-m)!\mod{p_i^{c_i}})}\)
问题就是如何快速计算\(x!\mod{p_i^{c_i}}\)
我们把阶乘的每一项展开来:\(x!=\prod_{k=1}^x{k}\)
试着每次从阶乘项里面提出\(p_i\)的倍数,进行计算:
\(x!=(p_i\cdot 2p_i\cdot 3p_i \cdots sp_i) \prod\limits_{1\leq k \leq x , p_i\nmid k}k\)
\(=p_i^s(s!)\prod\limits_{1\leq k \leq x , p_i\nmid k}k\)

由于模的循环性质,有:\(\prod\limits_{1\leq k \leq p_i^{c_i}}k\equiv \prod\limits_{p_i^{c_i} \leq k \leq 2p_i^{c_i}}k \equiv \cdots \pmod{p_i^{c_i}}\)

这样的循环节一共有\(\lfloor \frac{x}{p_i^{c_i}} \rfloor\)个。剩下的\(x-\lfloor \frac{x}{p_i^{c_i}} \rfloor\)就直接暴力计算就可以了。这有一点点分块的味道。

对于每一个循环节,我们只需要暴力计算其中一个\(p_i^{c_i}\)的部分,剩余的部分的答案是一样的。

典型地,我们采用网上流行的\(19!\mod 3^2\)来演示一下。

\(19!\equiv 1*2*3*4*5*6*7*8*9*10*11*12*13*14*15*16*17*18*19\)
\(\equiv (1*2*4*5*7*8)*(10*11*13*14*16*17)*(19)*(3*6*9*12*15*18)\)
\(\equiv (1*2*4*5*7*8)*(1*2*4*5*7*8)*(1)*3^6(1*2*3*4*5*6)\)

这里出现了两个循环节和一个剩余的数。快速幂+暴力求出前面部分的值,后面\(3^6\)可以指数相减,阶乘可以递归处理。

每算一个\(n!\mod p_i^{c_i}\)时间复杂度是\(O(p_i^{c_i}\log n(\log_{p_i}n-c_i))\)

这里就不加处理地粘贴了洛谷模板题

#include<bits/stdc++.h>
#define RP(i,a,b) for(register int i=a;i<=b;++i)
#define DRP(i,a,b) for(register int i=a;i>=b;--i)
#define fre(z) freopen(z".in","r",stdin),freopen(z".out","w",stdout)
#define mem(a,b) memset(a,b,sizeof(a))
#define prique priority_queue
#define rg register
#include<cstdlib>
#include<ctime>
#ifdef WIN32
#define OT "%I64d"
#else
#define OT "%lld"
#endif
using namespace std;
typedef long long ll;
typedef double db;
template<class T> T qr(T type)
{
	char ch=getchar();T ret=0;T q=1,res=1;
	while(!isdigit(ch))
		q=(ch=='-'?-1:q),ch=getchar();
	while(isdigit(ch))
		ret=ret*10+ch-'0',ch=getchar();
	if(ch=='.')
	{
		ch=getchar();
		while(isdigit(ch))
			ret=ret*10+ch-'0',res=res*10,ch=getchar();
	}
	return q==-1?-ret/res:ret/res;
}

ll n,m,P;

inline ll exgcd(ll a,ll b,ll &x,ll &y)
{
	if(b==0)
	{
		x=1,y=0;
		return a;
	}
	ll d=exgcd(b,a%b,y,x);
	y-=(a/b)*x;
	return d;
}

inline void put(ll x)
{
	if(x<0)
		x=-x,putchar('-');
	if(x>=10)
		put(x/10);
	putchar(x%10+'0');
}

inline ll qp(ll x,ll p,ll mod)
{
	ll ans=1;
	while(p)
	{
		if(p&1)
			ans=(ans*x)%mod;
		x=(x*x)%mod,p>>=1;
	}
	return ans;
}

ll MF(ll n,ll p,ll pc)//compute n! by pc norm
{
	if(n==0)
		return 1;
	ll res=1;
	for(rg ll i=2;i<=pc;++i)
		if(i%p)//don't compute the p factor for it has been computed out of the function.
			res=(res*i)%pc;//compute the single recurring period
	res=qp(res,n/pc,pc);//compute the all recurring period
	for(rg ll i=2;i<=n%pc;++i)//compute the res num. out of recper.
		if(i%p)
			res=(res*i)%pc;
	return res*MF(n/p,p,pc)%pc;
}

inline ll inver(ll n,ll mod)
{
	ll x,y;
	exgcd(n,mod,x,y);
	return (x+=mod)>mod?x-mod:x;
}

inline ll C(ll n,ll m,ll p,ll pc)
{
	ll fc_n=MF(n,p,pc),fc_m=MF(m,p,pc),fc_del=MF(n-m,p,pc);//n!,m!,(n-m)! by pc norm
	ll d=0;
	for(rg ll i=n;i>0;i/=p)
		d+=i/p;//d(n!)
	for(rg ll i=m;i>0;i/=p)
		d-=i/p;//d(m!)
	for(rg ll i=n-m;i>0;i/=p)
		d-=i/p;//d((n-m)!)
	//k=d(n!)-d(m!)-d((n-m)!)
	//d(n) is the fac p's num in n
	return fc_n*qp(p,d,pc)%pc*inver(fc_m,pc)%pc*inver(fc_del,pc)%pc;
}

inline ll CRT(ll b,ll mod)
{
	return b*inver(P/mod,mod)%P*(P/mod)%P;
}//add ans:aiMiti

/*
suppose P=\prod(p_i^{c_i})
the origin equation x=C(n,m)(mod P) is equivalance to:
{x=C(n,m)(mod p_i^{c_i})} for each factor is perpendicular
then we can solve the subans in turn and combine them.
ans=\sum_{i=1}^{n}{a_i M_i t_i}
M_i = P/(p_i^{c_i})
t_i is the inversion of M_i by p_i^{c_i} norm
 
*/

inline ll exlucas(ll n,ll m)//main function
{
	ll res=0,cur=P,pc;
	ll Sqr=sqrt(P)+5;
	for(rg ll i=2;i<=Sqr;++i) //limit the searching range:sqrt(n) technique
	{
		if(cur%i==0)// i|cur
		{
			pc=1;
			while(cur%i==0)
				pc*=i,cur/=i;//p_i=i,p_i^{c_i}=pc
			res=(res+CRT(C(n,m,i,pc),pc))%P;
		}
	}
	if(cur>1)//cur=sqrt(P)
		res=(res+CRT(C(n,m,cur,cur),cur))%P;
	return res;
}

int main()
{
	//fre("P4720");
	n=qr(1ll),m=qr(1ll),P=qr(1ll);
	put(exlucas(n,m));
	return 0;
}

2.2 证明中出现的一些重要推论

阶乘\(n!\)中含有某个素因子\(p\)的个数\(\text{d}_p(x)\)。我们可以根据上面的过程,得到一个递归公式:

\[ \text{d}_p(x)=\text{d}_p(\lfloor \frac{x}{p} \rfloor)+ \lfloor \frac{x}{p} \rfloor \tag{1} \]

展开这个递归式可以得到\(\text{d}_p(x)\)的计算公式:

\[ \text{d}_p(x)=\sum_{p^k \leq x} \lfloor \frac{x}{p^k} \rfloor \tag{1'} \]

posted @ 2019-03-28 22:12  LinearODE  阅读(322)  评论(0编辑  收藏  举报