【整理】素数【快速乘法改进】
一:【普通筛法】
从2一直除到n(或者√n),有可以整除的不是素数。
二:【Eratosthenes筛法】
如果一个数p是质数的话,那么它的倍数一定都是质数。所以我建立了一个布尔类型的数组isPrime,初始化都为true。我从2开始枚举,当我找到一个isPrime[p]仍然为true时,可以确定p一定是一个质数。接着我再将N以内所有p的倍数全部设定为isPrime[p*i]=false。
三:【Eular质数筛法】
Eratosthenes筛法,是一种非常古老的质数筛选算法。其时间复杂度为O(n log log n)。这个算法有一个冗余的地方:
比如合数10,在枚举2的时候我们判定了一次,在枚举5的时候我们又判定了一次。因此使得其时间复杂度比O(n)要高。
Eular筛法做了改进,避免了这样的情况,规定每个合数只用其【最小的一个质因数去筛】,其时间复杂度是O(n)的。
这个算法有两层循环,第一层遍历2到n之间的所有自然数i,看看它是不是质数,如果是,则把i放进prime数组中。第二层循环是对所有未来的数进行筛选。对于当前正在处理的i,显然它乘以任何一个已经找到的素数的结果肯定是和数,它们将会被剔除。
【核心】:当i可以被某个已经找到的质数整除的时候,循环退出,不再进行剔除工作。
比如i=93:筛去93*2(j1),筛去93*3(j2),但是93%3==0,所以退出。因为93/3=31,93*5(j3)=(31*5)*3=155*3,所以155会再筛一次。即是:i%p[j]==0,则i*p[j+x]必然能用(i/p[j])*(i+y)筛去。此时break保证了每个合数只用其最小的一个质因数去筛。
(所以最后测试结果是再1,000,000或者10,000,000左右的数据种,【Eular效率是埃式的3倍到4倍左右】,10,000,000的数据前者会跪,后者不会,数据越大,差异越明显;当然,数据小时,前者效率可能高一些)。
四:【Miller-Rabin质数测试】
前面三种是预处理1-n的所有素数,但是有时只需要判断某个数是不是素数,于是:
这种质数算法是基于费马小定理的一个扩展,首先我们要知道什么是费马小定理:
【费马小定理】:对于质数p和任意整数a,有a^p ≡ a(mod p)(同余)。反之,若满足a^p ≡ a(mod p),p也有很大概率为质数。 将两边同时约去一个a,则有a^(p-1) ≡ 1(mod p)
也即是说:假设我们要测试n是否为质数。我们可以随机选取一个数a,然后计算a^(n-1) mod n,如果结果不为1,我们可以100%断定n不是质数。
否则我们再随机选取一个新的数a进行测试。如此反复多次,如果每次结果都是1,我们就假定n是质数。
该测试被称为【Fermat测试】。需要注意的是:Fermat测试不一定是准确的,有可能出现把合数误判为质数的情况。
Miller和Rabin在Fermat测试上,建立了Miller-Rabin质数测试算法。
与Fermat测试相比,多了一个【二次探测定理】:
如果p是奇素数,则 x^2 ≡ 1(mod p)的解为 x ≡ 1 或 x ≡ p - 1(mod p)
如果a^(n-1) ≡ 1 (mod n)成立,Miller-Rabin算法不是立即找另一个a进行测试,而是看n-1是不是偶数。如果n-1是偶数,令u=(n-1)/2,并检查是否满足二次探测定理即a^u ≡ 1 或 a^u ≡ n - 1(mod n)。
举个Matrix67 Blog上的例子,假设n=341,我们选取的a=2。则第一次测试时,2^340 mod 341=1。由于340是偶数,因此我们检查2^170,得到2^170 mod 341=1,满足二次探测定理。同时由于170还是偶数,因此我们进一步检查2^85 mod 341=32。此时不满足二次探测定理,因此可以判定341不为质数。
将这两条定理合起来,也就是最常见的【Miller-Rabin测试】。
但一次MR测试仍然有一定的错误率。为了使我们的结果尽可能的正确,我们需要进行多次MR测试,这样可以把错误率降低。
值得一提的是,Miller-Rabin每次测试失误的概率是1/4;进行S次后,失误的概率是4^(-S)。
每一次单独的MR测试,需要O(log n)的时间。一共要进行S次MR测试,也就是O(Slog n)。
这样就能够在很短的时间内完成质数的测试了。当然如果你还是不放心,可以把S的值设定的更高一点。
这样就能够顺利的找到大质数了。
Wiki中,介绍了一些【小技巧】:比如如果n<2^64,只用选取a={2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37}做测试即可
(参考:http://www.matrix67.com/blog/archives/234)
以上是初步整理。
算法4的代码(【快速幂和快速乘法】):
poj1811:
#include<cstdio> #include<cstdlib> #include<iostream> #include<algorithm> #include<memory> #include<cstring> #define ll long long #define q_pow pow_mod #define q_mul mult_mod using namespace std; ll qmul(ll a,ll b,ll Mod) { a%=Mod; b%=Mod; ll ans=0,tmp=a; while(b){ if(b&1) { ans+=tmp; if(ans>Mod) ans-=Mod; } tmp<<=1;b>>=1; if(tmp>Mod) tmp-=Mod; } return ans; } ll qpow(ll a,ll t,ll Mod) { ll ans=1; a%=Mod; while(t){ if(t&1) ans=qmul(ans,a,Mod); a=qmul(a,a,Mod); t>>=1; } return ans; } bool check(ll a,ll n,ll x,ll t) { ll ret=qpow(a,x,n),last=ret; for(int i=1;i<=t;i++){ ret=qmul(ret,ret,n); if(ret==1&&last!=1&&last!=n-1) return true;//合数 last=ret; } if(ret!=1) return true; return false; } // Miller_Rabin()算法素数判定 //是素数返回true.(可能是伪素数,但概率极小) //合数返回false; bool Miller_Rabin(ll n) { if(n<2)return false; if(n==2)return true; if((n&1)==0) return false;//偶数 ll x=n-1; ll t=0; while((x&1)==0){x>>=1;t++;} int S=20; for(int i=0;i<S;i++) { ll a=rand()%(n-1)+1;//rand()需要stdlib.h头文件 if(check(a,n,x,t)) return false;//合数 } return true; } ll fac[200];int tot; ll gcd(ll a,ll b){ if(a==0) return 1; if(a<0) return gcd(-a,b); while (b) {ll t=a%b; a=b; b=t;} return a; } ll Pollard_rho(ll x,ll c){ ll i=1,x0=rand()%x,y=x0,k=2; while (1){ i++; x0=(qmul(x0,x0,x)+c)%x; ll d=gcd(y-x0,x); if(d!=1&&d!=x) return d; if(y==x0) return x; if(i==k) y=x0,k+=k; } } void find(ll n){ //递归进行质因数分解N if(Miller_Rabin(n)){ fac[++tot] = n; return; } ll p=n; while (p>=n) p=Pollard_rho(p,rand()%(n-1)+1); find(p); find(n/p); } int main() { int T;ll n; scanf("%d",&T); while(T--){ scanf("%lld",&n); if(Miller_Rabin(n)) printf("Prime\n"); else { tot=0; find(n); ll Mn=fac[1]; for(int i=2;i<=tot;i++) Mn=min(Mn,fac[i]); printf("%lld\n",Mn); } } return 0; }