把博客园图标替换成自己的图标
把博客园图标替换成自己的图标end

Miller Rabin素数测试和Pollard Rho算法

翻了好多博客和题解,感觉都讲得不是很清晰qwq,很多地方就一个显然轻飘飘地带过,自己想了好久才想通。

\(Miller\ Rabin\)素性测试

\(MillerRabin\)算法是一种高效的单个质数判定方法。虽然是一种不确定的质数判断法,但是在选择多种底数的情况下,正确率是可以接受的。它可以判定的数字范围较大,速度也比较优秀,所以是一种比较实用的算法。

前置定理

费马小定理

\(p\)是质数,则\(a^p\equiv a\mod p\),如果\(a\)不是\(p\)的倍数,还可以写成\(a^{p-1}\equiv 1\mod p\),这种写法更常见一些。

二次探测定理

\(p\)是素数且\(x^2\equiv 1\mod p\),则满足\(x\equiv 1\mod p\)\(x\equiv p-1\mod p\)

证明:

因为\(x^2\equiv 1\mod p\),所以\(x^2-1\equiv 0\mod p\),则\(p|(x+1)(x-1)\)

又因为\(p\)是质数,所以\((x+1)\)\((x-1)\)有因子\(p\),则\(p|(x+1)\)\(p|(x-1)\)

\(x+1\equiv p \mod p\)\(x-1\equiv p \mod p\)

\(x\equiv p-1 \mod p\)\(x\equiv 1 \mod p\)

\(Q.E.D.\)

算法分析

设我们要判定的数为\(x\),我们用一个素数\(p\)来进行判定。

首先,如果\(x==p\),那么\(x\)是素数;如果\(p|x\),那么\(x\)不是素数。可以特判掉。

然后,先用费马小定理进行测试(这一步也叫做费马测试),如果\(p^{x-1}\%x!=1\),那么\(x\)不是质数。

否则,我们用二次探测定理进行测试。

\(k=x-1\),如果\(2|k\),显然有\((p^{\frac k 2})^2\%x==1\),因为这个式子等价于\(p^{x-1}\%x==1\),就是费马小定理,刚才已经判断过了。

\(t=p^{\frac k 2}\%x\),根据二次探测定理,如果\(t!=1||t!=x-1\),那么\(x\)不是素数。

如果\(t==1\),那么把\(p^{\frac k 2}\%x==1\)看作是新的一个条件,如果\(2 | k\),将\(k/2\),继续重复刚才的内容,判定\(p^{\frac k 4}\);当然,如果\(k\)已经是奇数,那么无法继续判定,所以认定\(x\)是素数。

如果\(t==x-1\),不符合二次探测定理的那个条件式,那么就没有办法继续判定,所以认定\(x\)是素数。

以上就是\(MillerRabin\)的算法流程了。

事实上存在很少一部分强伪素数是没有办法被\(MillerRabin\)算法筛掉,所以可以多选几个底数\(p\)进行判定,它能逃脱所有底数的筛选的概率很小,正确率是在可接受范围内的。

经过大佬的经验传授,如果\(x<=10^{12}\)\(p\)\(\{2,13,23,1662803\}\)就可以。

如果\(x<=10^{18}\)\(p\)\(\{2,3,5,7,11,13,17,19,23\}\)就可以。

Code View

const int P[]={2,3,5,7,11,13,17,19,23},pn=9;
int ksm(int a,int b,int MOD)
{
	int res=1;
	while(b)
	{
		if(b&1) res=1ll*res*a%MOD;
		a=1ll*a*a%MOD;
		b>>=1;
	}
	return res;
}
bool check(int x,int p)
{
	if(ksm(p%x,x-1,x)!=1) return 0;
	int k=x-1,t;
	while(!(k&1))
	{
		k>>=1;
		t=ksm(p%x,k,x);
		if(t!=1&&t!=x-1) return 0;
		if(t==x-1) return 1;//不符合二次探测的条件式 没有办法继续判定 
	}
	return 1;//k变成了奇数 仍然没有筛出来 
}
bool Miller(int x)
{
	for(int i=1;i<=pn;i++)
	{
		if(x==P[i]) return 1;
		if(x%P[i]==0) return 0;
		if(!check(x,P[i])) return 0;
	}
	return 1;
} 

在快速幂会\(T\)的情况下,可以先把\(2\)提出来,然后逆着做,倒着乘过去。

\(Pollard\ Rho\)算法

\(Pollard\ Rho\)算法是一个大数质因数分解算法,它的实现是基于\(Miller\ Rabin\)素性测试。它是一种比较玄学的随机化算法,《算法导论》给出的时间复杂度是\(O(\sqrt p)\)的,\(p\)\(n\)的一个最小因子。

算法分析

设我们要分解的数是\(x\)

首先,我们用\(Miller\ Rabin\)判断一下\(x\)是否为质数,如果是,那么就可以统计信息然后返回。

接下来,我们考虑如果可以找到一个数\(y\)使得\(1<gcd(x,y)<x\)\(gcd(x,y)\)就是\(x\)的一个非平凡因子,然后可以把\(x\)分成\(gcd(x,y)\)\(\frac x{gcd(x,y)}\)两部分进行递归计算。

然后考虑怎么求这个\(y\)。首先随机化一个数\(v_0∈[0,x-1]\),然后生成一个序列\(v_i=f(v_{i-1})%x\),其中\(f(n)\)是一个伪随机数函数,例如\(f(n)=n^2+t\),\(t\)是常数。

\(v[]\)是会形成一个环的,环的最长长度是\(x\),因为最长到第\(x+1\)个数时就会重复,而这个映射关系是唯一的,所以就会成环。

根据生日悖论,环长的期望是\(\sqrt x\),所以复杂度可以保证。不过这个结论我不知道怎么证它,所以大概可以用一个期望\(dp\)来验证的方法来说明它是对的?

定义\(f[i]\)表示序列已经排到了第\(i\)个数,\([1,i-1]\)中的数都互不相同形成的环长的期望。

那么\(f[x+1]=x,f[i]=\frac {i-1} x*\frac{(1+(i-1))*i}{2*i}+\frac{x-i+1}{x}*f[i+1]\)

前面是和\([1,i-1]\)的数一样产生的期望,和\(v[i-1]\)一样环长是\(1\),和\(v[i-2]\)一样环长是\(2\)...概率是一样的,所以求一个平均值就是期望;后面是和前面的数都不一样的产生的期望。

我们可以写出代码:

double f[N];
void work()
{
	int x=rd();
	f[x+1]=x;
	for(int i=x;i>=1;i--)
		f[i]=1.0*(i-1.0)/x*i/2+1.0*(x-i+1)/x*f[i+1];
	printf("%.9f\n%.9f",f[1],f[1]*f[1]);
}

实际结果的话,比\(\sqrt x\)小,\(\sqrt x\)大概是结果的\(2\)\(3\)倍。


对于求出来的\(v_i\),算出\(d=gcd(|v_i-v_0|,x)\),并判断\(1<d<x\),如果满足就记录\(d\)并继续递归计算。

如果已经成环了,就没用了,就分解失败,可以调整\(t\)的值并重新分解。

关于如何探测环的出现,一个稍微有点暴力的方法是每次都存下来,判断是否有出现过,但这样做在数据范围比较大的时候会\(MLE\)。一种比较有意思的做法是\(Floyd\)提出来的(怎么又是他)。在一个很长的圆形轨道上行走,要判断什么时候至少走了一圈,我们可以让\(A,B\)同时从同一起点开始走,\(B\)的速度是\(A\)的两倍,当\(B\)第一次赶上\(A\)的时候,\(B\)就走了至少一圈了(准确地来说,应该是2圈?\(t=\frac L v,S_B=2v*t=2L\))。

优化:我们每求出一个\(v_i\)就求了一个\(gcd\)\(gcd\)求得太过频繁,我们完全可以把很多个数累在一起求\(gcd\),不会影响正确性。因为如果\(gcd(p,x)>1\),那么\(gcd(p*q,x)>1\)

Code View

洛谷板题:P4718 【模板】Pollard-Rho算法

#include<cstdio>
#include<algorithm>
#include<queue>
#include<cstring>
#include<iostream>
#include<cstdio>
#include<cmath>
#include<map>
using namespace std;
#define INF 0x3f3f3f3f
#define LL long long
LL rd()
{
	LL x=0,f=1;char c=getchar();
	while(c<'0'||c>'9'){if(c=='-')f=-1; c=getchar();}
	while(c>='0'&&c<='9'){x=(x<<3)+(x<<1)+(c^48); c=getchar();}
	return f*x;
}
LL ans;
LL Abs(LL x)
{
	if(x>=0) return x;
	return -x;
}
LL gcd(LL a,LL b)
{
	if(b==0) return a;
	return gcd(b,a%b);
}
LL qmul(LL x,LL y,LL MOD)
{//快速乘 
	return (x*y-(long long) ((long double) x/MOD*y)*MOD+MOD)%MOD;
}
const int P[]={0,2,3,5,7,11,13,17,19,23},pn=9;
int ksm(int a,int b,int MOD)
{
	int res=1;
	while(b)
	{
		if(b&1) res=1ll*res*a%MOD;
		a=1ll*a*a%MOD;
		b>>=1;
	}
	return res;
}
bool check(LL x,LL p)
{
	if(ksm(p%x,x-1,x)!=1) return 0;
	LL k=x-1,t;
	while(!(k&1))
	{
		k>>=1;
		t=ksm(p%x,k,x);
		if(t!=1&&t!=x-1) return 0;
		if(t==x-1) return 1;
	}
	return 1;
}
bool Miller(LL x)
{
	for(int i=1;i<=pn;i++)
	{
		if(x==P[i]) return 1;
		if(x%P[i]==0) return 0;
		if(!check(x,P[i])) return 0;
	}
	return 1;
}
void Rho(LL x)
{//
	if(Miller(x))
	{
		ans=max(x,ans);
		return ;
	}
	LL t1=rand()%(x-1)+1;
	LL t2=t1,b=rand()%(x-1)+1;
	t2=(qmul(t2,t2,x)+b)%x;
	LL p=1,i=0;
	while(t1!=t2)
	{
		i++;
		p=qmul(p,Abs(t1-t2),x);
		if(p==0)
		{
			LL t=gcd(Abs(t1-t2),x);
			if(t!=1&&t!=x)
			{
				Rho(t);
				Rho(x/t);
			}
			return ;
		}
		if(i%127==0)//为什么是127...玄学
		{
			p=gcd(p,x); 
			if(p!=1&&p!=x)
			{
				Rho(p);
				Rho(x/p);
				return ;
			}
			p=1;
		} 
		t1=(qmul(t1,t1,x)+b)%x;
		t2=(qmul(t2,t2,x)+b)%x;
		t2=(qmul(t2,t2,x)+b)%x;
	}
	p=gcd(p,x);
	if(p!=1&&p!=x)
	{
		Rho(p);
		Rho(x/p);
		return ;
	}
}
int main()
{
	int T=rd();
	while(T--)
	{
		LL x=rd();
		if(Miller(x))
		{
			puts("Prime");
			continue;
		}
		ans=0;
		while(ans==0)
			Rho(x);
		printf("%lld\n",ans); 
	}
    return 0;
}

(MR还好,PR就是真的脑壳大

posted @ 2020-08-14 09:05  Starlight_Glimmer  阅读(191)  评论(0编辑  收藏  举报
浏览器标题切换
浏览器标题切换end