数论细节梳理&模板

初阶

扩展欧拉

\(k\ge\varphi(m)\)时，\(b^k\equiv b^{k\%\varphi(m)+\varphi(m)}(\bmod m\))

扩展CRT

推式子合并同余方程。
https://www.cnblogs.com/flashhu/p/9346078.html

扩展BSGS

根号大暴力，就是细节很多。
https://www.cnblogs.com/flashhu/p/9737769.html

扩展Lucas

对于模数不是质数的，唯一分解为\(\prod p_i^{k_i}\)，算出组合数对每一个\(p_i^{k_i}\)取模的结果，用CRT合并。
问题在于求\(n!\%p^k\)。
将\(n!\)中所有\(p\)因子提出来，因子个数\(\sum\limits_{i=1}\lfloor\frac{n}{p^i}\rfloor\)。
剩下的数的贡献单独考虑，记为\(F_n\)，发现它在模意义下以\(p^k\)为周期，\(fac_n=F_{p^k}^{\lfloor\frac{n}{p^k}\rfloor}F_{n\%p^k}fac_{\lfloor\frac n p\rfloor}\)，递归处理。
时间复杂度\(\sum p_i^{k_i}\)。
洛谷P4720 【模板】扩展卢卡斯

#include<bits/stdc++.h>
#define LL long long
#define R register LL
using namespace std;
LL n,m,YL,F[1000009];
void exgcd(R a,R b,R&x,R&y){
    if(!b){x=1;y=0;return;}
    exgcd(b,a%b,y,x);y-=a/b*x;
}
inline LL qpow(R b,R k,R p){
    R a=1;
    for(;k;k>>=1,b=b*b%p)
        if(k&1ll)a=a*b%p;
    return a;
}
LL fac(R n,R p,R k){
    return n?qpow(F[k],n/k,k)*F[n%k]%k*fac(n/p,p,k)%k:1;
}
inline LL inv(R n,R p){
    R x,y;exgcd(n,p,x,y);
    return x<=0?x+p:x;
}
inline LL cnt(R n,R p){
    R k=0;
    for(n/=p;n;n/=p)k+=n;
    return k;
}
inline LL C(R n,R m,R p,R k){
    for(R i=F[0]=1;i<=k;++i)
        F[i]=i%p?F[i-1]*i%YL:F[i-1];
    return fac(n,p,k)*inv(fac(m,p,k),k)%k*inv(fac(n-m,p,k),k)%k*qpow(p,cnt(n,p)-cnt(m,p)-cnt(n-m,p),k)%k;
}
inline LL CRT(R a,R p){
    return YL/p*inv(YL/p,p)%YL*a%YL;
}
int main(){
    cin>>n>>m>>YL;
    R now=YL,lim=sqrt(YL),ans=0;
    for(R p=2;p<=lim;++p){
        if(now%p)continue;
        R k=1;while(now%p==0)now/=p,k*=p;
        ans=(ans+CRT(C(n,m,p,k),k))%YL;
        lim=sqrt(now);
    }
    if(now>1)ans=(ans+CRT(C(n,m,now,now),now))%YL;
    cout<<ans<<endl;
    return 0;
}

进阶

Miller-Rabin&Pollard-Rho

背板子
洛谷P4718 【模板】Pollard-Rho算法
辣鸡卡常题，参考了一下讨论版里的卡常技巧
upd:模数为long long级别的乘法取模原理
如果NOI能用什么__int128的话倒还好说
但是别忘了long double和__int128的位长是一样的啊！因此用它做long long级别的运算的精度损失是完全可以接受的。
我们知道\(a*b\bmod p=a*b-\lfloor\frac{a*b}p\rfloor*p\)
然后我们用long double先除后乘，考虑浮点数除法会丢掉小数点后面一个很小的值，而之后强制转换整形是要强制舍去的，所以要加一个eps。

#include<bits/stdc++.h>
#define SL __int128
#define LL long long
#define RG register
#define R RG int
using namespace std;
LL t,n,ans;
inline LL Mul(LL a,LL b,LL p){//㧟的玄学乘法取模
    LL d=((long double)a/p*b+1e-8);
    LL r=a*b-d*p;
    return r<0?r+p:r;
}
inline LL Gcd(LL a,LL b){//㧟的builtin辗转相减
    if(!a||!b)return a|b;
    int t=__builtin_ctzll(a|b);
    a>>=__builtin_ctzll(a);
    do{
        b>>=__builtin_ctzll(b);
        if(a>b)swap(a,b);
        b-=a;
    }while(b);
    return a<<t;
}
inline LL Qpow(LL b,LL k,LL p,LL a=1){
    for(;k;k>>=1,b=(SL)b*b%p)
        if(k&1ll)a=(SL)a*b%p;
    return a;
}
inline LL MR(LL n){
    if(n==2)return 1;
    if(n==1||(1&n)==0)return 0;
    static int a[]={2,3,7,13,61,24251};
    LL u=n-1,x,y;R k=0;
    while((1&u)==0)u>>=1,++k;
    for(R i=0;i<6&&a[i]<n;++i){
        x=Qpow(a[i],u,n);
        for(R j=0;j<k;++j,x=y){
            y=(SL)x*x%n;
            if(y==1&&x!=1&&x!=n-1)return 0;
        }
        if(x!=1)return 0;
    }
    return 1;
}
inline LL F(LL a,LL c,LL n){
    LL t=Mul(a,a,n)+c;
    return t<n?t:t-n;
}
inline LL PR(LL n){
    if((1&n)==0)return 2;
    LL c=rand(),a=rand(),b=a,g;
    do{
        a=F(a,c,n);b=F(F(b,c,n),c,n);
        g=Gcd(n,abs(a-b));
        if(g!=1&&g!=n)return g;
    }while(a!=b);
    return g;
}
void find(LL n){
    if(n==1||n<=ans)return;
    if(MR(n)){ans=max(ans,n);return;}
    LL d=n;
    while(d==n)d=PR(n);
    while(n%d==0)n/=d;
    find(n);find(d);
}
int main(){
    srand(time(NULL));
    cin>>t;
    while(t--){
        cin>>n;ans=1;find(n);
        if(ans==n)puts("Prime");
        else cout<<ans<<'\n';
    }
    return 0;
}

狄利克雷卷积&杜教筛

积性函数的性质：两个积性函数的狄利克雷卷积还是积性函数。
有一些推式子题里需要通过构造积性函数来加快函数求值。
常用的卷积式
\(\mu*\textbf1=\epsilon\Leftrightarrow\sum\limits_{d|n}\mu(d)=[n==1]\)
\(\varphi*\textbf1=\textbf{id}\Leftrightarrow\sum\limits_{d|n}\varphi(d)=n\)
\(\mu*\textbf{id}=\varphi\Leftrightarrow\sum\limits_{d|n}\frac{n}{d}\mu(d)=\varphi(n)\)
\(\textbf1*\textbf1=\textbf{d};\textbf{d}*\textbf1=\sigma\)（感觉还有很多都是可以相互推出来的）

杜教筛：求积性函数\(f\)的前缀和（记为\(S\)）。
构造积性函数\(g\)，前提是\(g\)和\(F=f*g\)的前缀和都可以\(O(1)\)算。
\(\sum\limits_{i=1}^nF(i)=\sum\limits_{i=1}^n\sum\limits_{xy=i}f(x)g(y)=\sum\limits_{y=1}^ng(y)\sum\limits_{x=1}^{\lfloor\frac{n}{y}\rfloor}f(x)=g(1)S(x)+\sum\limits_{y=2}^ng(y)S(\lfloor\frac n y\rfloor)\)
\(g(1)S(x)=\sum\limits_{i=1}^nF(i)-\sum\limits_{y=2}^ng(y)S(\lfloor\frac n y\rfloor)\)
看到了可以整除分块+递归的地方。
预处理\(F,g\)到\(n^\frac 2 3\)的前缀和，时间复杂度\(O(n^\frac 2 3)\)。
洛谷P4213 【模板】杜教筛（Sum）

#include<bits/stdc++.h>
#define LL long long
#define UI unsigned int
#define RG register
#define R RG int
using namespace std;
const LL N=2147483648,M=1.7e6,L=2000;
int pr[M],cnt;bool vis[M];
struct Dat{LL p;int u;}s[M],t[L];
Dat&S(UI n){
    if(n<M)return s[n];
    UI x=N/n;if(vis[x])return t[x];vis[x]=1;
    Dat&ans=t[x];
    ans.p=(LL)n*(n+1)>>1;ans.u=1;
    for(UI l=2,r;l<=n;l=r+1){
        r=n/(n/l);Dat&ret=S(n/l);
        ans.p-=(r-l+1)*ret.p;
        ans.u-=(r-l+1)*ret.u;
    }
    return ans;
}
int main(){
    s[1]=(Dat){1,1};vis[1]=1;
    for(R i=2;i<M;++i){
        if(!vis[i])s[pr[++cnt]=i]=(Dat){i-1,-1};
        for(R j=1,x;j<=cnt&&(x=i*pr[j])<M;++j){
            vis[x]=1;
            if(i%pr[j]==0){s[x].p=s[i].p*pr[j];break;}
            s[x].p=s[i].p*(pr[j]-1);s[x].u=-s[i].u;
        }
        s[i].p+=s[i-1].p;s[i].u+=s[i-1].u;
    }
    memset(vis,0,M);
    R t,n;cin>>t;
    while(t--){
        cin>>n;
        Dat ret=S(n);
        cout<<ret.p<<' '<<ret.u<<endl;
        memset(vis,0,L);
    }
    return 0;
}

Min_25筛

同样是求积性函数前缀和，不过扩展性很强。
yyb巨佬告诉我这是今年新鲜出炉的筛法，吊打了某洲阁筛（话说写这句话的时候是今年的最后一天了）
核心思想是体现在Step2中的将最小质因子相同的数的贡献一起算。
应用前提：对于\(p\in P\)，\(f(p)\)是一个简单多项式，\(f(p^e)\)可以快速计算。比某杜教筛不知道高到哪里去了。
时间复杂度玄学，但是跑得快
https://www.cnblogs.com/cjyyb/p/10169190.html
https://www.cnblogs.com/cjoieryl/p/9403579.html
https://www.cnblogs.com/zhoushuyu/p/9187319.html
https://www.cnblogs.com/cx233666/p/10173977.html
https://www.cnblogs.com/GuessYCB/p/10061411.html （都是高级操作）

Step1

把多项式拆开，对每个\(f(x)=x^k\)的项分开算贡献。
把\(\sqrt N\)范围的质数筛出来，记为\(P\)。预处理质数的函数前缀和\(fs\)。
先对于每个\(i\le \sqrt N\)求\(\sum\limits_{x=1}^{\lfloor\frac N i\rfloor}[x\in P]f(x)\)。
设\(g(n,j)\)为\(x\in[1,n]\)中满足\(x\in P\)或\(x\)的最小质因子小于\(P_j\)的\(f(x)\)之和
于是显然有\(g(n,|P|)=\sum\limits_{x=1}^{n}[x\in P]f(x)\)。
实现过程：滚动数组，外层枚举\(j\)，直接用一维数组保存每一个\(n=\lfloor\frac N i\rfloor\)当前的\(g(n,j)\)。
内层枚举\(i\)，有\(g(n,j)=g(n,j-1)-f(P_j)\cdot(g(\lfloor\frac{n}{P_j}\rfloor,j-1)-fs(j-1))\)，结合定义用容斥思想理解。

Step2

开始算答案了。
设\(S(n,j)\)为\(x\in[1,n]\)中满足\(x\)的最小质因子大于等于\(P_j\)的\(f(x)\)之和（注意和\(g\)的区别）
于是我们要求的答案即是\(S(N,1)+f(1)\)（\(S\)里面不包含\(f(1)\)）
求\(S(n,j)\)时，分质数和合数算贡献
质数：\(g(n,|P|)-fs(j-1)\)
合数：枚举最小质因子\(P_j\)以及它的次数\(e\)，相同的一起算（注意不包含\(f(1)\)，因此还有一个尾项）
\(\sum\limits_{k=j}^{P_k^2\le n}\sum\limits_{e=1}^{P_k^{e+1}\le n}S(\lfloor\frac{n}{P_k^e}\rfloor,k+1)f(P_k^e)+f(P_k^{e+1})\)
LOJ6053 简单的函数

#include<bits/stdc++.h>
#define LL long long
#define RG register
#define R RG LL
using namespace std;
const LL N=2e5+9,YL=1e9+7;
LL n,Sq,p,m,pr[N],id1[N],id2[N],w[N],fx[N],gx[N],g1[N];
bool np[N];
inline LL Getid(R x){
	return x<=Sq?id1[x]:id2[n/x];
}
void Sieve(){
	for(R i=2;i<=Sq;++i){
		if(np[i])continue;
		pr[++p]=i;fx[p]=(fx[p-1]+i)%YL;
		for(R j=i*i;j<=Sq;j+=i)np[j]=1;
	}
}
LL S(R n,R j){
	if(n<=1||pr[j]>n)return 0;
	R x=Getid(n);
	R ret=(gx[x]-fx[j-1]-g1[x]+j-1+2*YL)%YL;
	for(R k=j;k<=p&&pr[k]*pr[k]<=n;++k){
		R p1=pr[k],p2=p1*p1;
		for(R e=1;p2<=n;++e,p1=p2,p2*=pr[k])
			ret=(ret+S(n/p1,k+1)*(pr[k]^e)+(pr[k]^(e+1)))%YL;
	}
	return ret;
}
int main(){
	cin>>n;
	if(n==1)return puts("1"),0;
	Sq=sqrt(n);Sieve();
	for(R i=1,j;i<=n;i=j+1){
		R x=w[++m]=n/i;j=n/x;
		(x<=Sq?id1[x]:id2[n/x])=m;
		gx[m]=(x+2)%YL*((x-1)%YL)%YL*((YL+1)>>1)%YL;
		g1[m]=(x-1)%YL;
	}
	for(R j=1;j<=p;++j)
		for(R i=1;i<=m&&pr[j]*pr[j]<=w[i];++i){
			R x=Getid(w[i]/pr[j]);
			gx[i]=((gx[i]-pr[j]*(gx[x]-fx[j-1]))%YL+YL)%YL;
			g1[i]=(g1[i]-g1[x]+j-1+YL)%YL;
		}
	return cout<<S(n,1)+3<<endl,0;
}

posted @ 2018-12-28 14:33 Flash_Hu 阅读(793) 评论(2) 收藏举报

刷新页面返回顶部

FlashHu

——蝌