拖了有段时间,今天来总结下两个常用的素数筛法:
1、sieve of Eratosthenes【埃氏筛法】
这是最简单朴素的素数筛法了,根据wikipedia,时间复杂度为 ,空间复杂度为O(n)。
算法思想:先假定所有的数都是素数,然后从最小的素数2出发,把素数的所有倍数筛出去。又因为一个数的质因数都是成对出现的,比如100 = 1*100 = 2*50 = .....= 10*10,所以筛素数时只用筛到 n的开平方就行了。
伪代码如下:
对于任意的范围n,
设bool prime[ ],初始化 2→n 的元素为false,
for(i=2; i < sqrt(n); i+++)
if (!prime[ i ])
for(j = i*i; j * i < n; j+=i)
prime[ j ] = false
2、sieve of Euler【欧拉线性筛】
尽管把埃氏筛法“优化”到n的开平方,但是还是做了很多重复的工作,比如 合数 6,它就会被2,和3重复筛出。
根据“每个整数都可以分解成它的 质因数之积”,因此每个数只需要被它的最小质因数筛除。
由上可以得到线性时间复杂度的筛法,欧拉筛法。
算法思路:
欧拉筛是个以空间换时间的算法,用prime[ ]数组记录素数,初始bool数组is_prime[ ]为false记录每个数是否是素数,
伪代码如下:
k = 0
for(i = 2; i < n; i++)
if(!is_prime[i])
prime[k++] = i
for(j = 0; j < k&&i * prime[ j ]; j++)
is_prime[i*prime[ j ]] = true;
if(i % prime[ j ]) break; //关键步骤。在此的prime[ j ]一定是i的最小质因子,you can gusse why~0-0
【以下是实现代码,外加两种算法在时间上的比对】
#include<iostream> #include<cstdio> #include<ctime> #include<cstring> using namespace std; const long long maxn = 100000000; bool is_prime[maxn]; int EUprime[maxn]; bool ERprime[maxn]; int euler(int n){ int k = 0; memset(is_prime,false, sizeof(is_prime)); for(int i = 2; i <= n; i++){ if(!is_prime[i]) EUprime[k++] = i; for(int j = 0; j < k&&i * EUprime[j] <= n; j++){ is_prime[i*EUprime[j]] = true; if(i % EUprime[j] == 0) break; } } return k; } int eratosthense(int n){ int k = 0; memset(ERprime,false,sizeof(ERprime)); for(int i = 2; i * i <= n; i++){ if(!ERprime[i]){ for(int j = i*i; j <= n; j+=i){ ERprime[j] = true; } } } for(int i = 2; i <= n; i++) if(!ERprime[i]) {k++;} return k; } int main(){ //int n; clock_t st,ed; double sec; for(int i = 10; i < 1000000000; i *= 10){ cout<<i<<":"<<endl; int res; st = clock(); res = eratosthense(i); ed = clock(); sec = (double)(ed - st) / (double) CLOCKS_PER_SEC; printf("eratosthense :\t\t%8d\t%.8lf\n", res, sec); st = clock(); res = euler(i); ed = clock(); sec = (double)(ed - st) / (double) CLOCKS_PER_SEC; printf("Euler :\t\t%16d\t%.8lf\n", res, sec); } }
【可以看到在小数据上两个算法效率差别不大,在大数据情况下,Euler筛法的效率明显比埃氏筛法高】