素数筛选
经典:
int isprime(int n)
{
int i;
if(n<=1) return 0;
for(i=2;i<=sqrt(n);i++)
if(n%i==0) return 0;
return 1;
}
显然如果要判断一定范围内的素数,这种算法很慢。
埃拉托斯特尼(Eratosthenes)筛法
int flag[maxn+5]={1,1}; //if(flag[i]=0) i为素数
void isprime()
{
int i,j;
memset(flag,0,sizeof(flag));
for(i=2;i<=sqrt(N);i++)
{
if(!flag[i])
{
for(j=i*i;j<=N;j+=i)
flag[j]=1;
}
}
}
欧拉(Euler)筛法
int flag[maxn+5]={1,1},prime[maxn+5]; //if(flag[i]=0) i为素数
void isprime()
{
int i,j,cnt=0;
memset(flag,0,sizeof(flag));
for(i=2;i<=maxn;i++)
{
if(!flag[i]) prime[cnt++]=i;
for(j=0;j<cnt&&prime[j]*i<=maxn;j++)
{
flag[prime[j]*i]=1;
if(i%prime[j]==0) break;
}
}
}
为什么当 i|prime[j] 时,就可以跳出循环?
,令i|prime[j]=m,所以,可以看出i*prime[j+1]可以由k'*prime[j]得到,又因为prime[j+1]>prime[j],所以k'肯定比此时的i大,也就是说i*prime[j+1]可以在以后被更新,所以此时不用,以免重复计算。
区间素数筛
引:给定整数 a 和 b,请问区间 [a,b) 内有多少个素数?(a<b≤10^12,b−a≤10^6)
因为 b 以内合数的最小质因数一定不会超过√b ,因为如果存在 d 是 n 的约数,那么 n/d 也是 n 的约数,由 n=d×n/d 可知 min(d,n/d)≤√n。
如果有√n以内的素数表的话,就可以把埃式筛法用在[a,b)上了。也就是说,先分别做好[2,√b)的表和[a,b)的表,然后从[2,√b)的表中筛得素数的同时,也将其倍数从[a,b)的表中筛去,最后剩下的就是区间[a,b)内的素数了。
假如要求[1e^9,1e^9+2)区间内的素数,难道我们要开1e^9+3 大小的数组吗?其实并不用,我们利用下标偏移,可以减少空间开销。即将[1e^9,1e^9+2)对应到[0,2),整体区间向左偏移 1e^9。
说白了,就是用已知小范围素数更新未知大范围素数,然后利用下标偏移维护区间。
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAXN = 1e5;
bool is_prime[MAXN],is_prime_small[MAXN];
ll prime[MAXN],prime_num = 0;
//对区间[a,b)内的整数执行筛法,is_prime[i-a]=true <=> 表示i是素数(下标偏移了a)
void segment_sieve(ll a,ll b)
{
for(ll i=0;i*i<b;i++) is_prime_small[i]=true;//对[2,sqrt(b))的初始化全为质数
for(ll i=0;i<b-a;i++) is_prime[i]=true;//对下标偏移后的[a,b)进行初始化
for(ll i = 2; i * i < b; i++) //筛选[2,sqrt(b))
{
if(is_prime_small[i])
{
for(ll j=2*i;j*j<b;j+=i)
is_prime_small[j]=false;
//(a+i-1)/i 得到最接近a的i的倍数,最低是i的2倍,然后筛选
for(ll j=max(2LL,(a+i-1)/i)*i;j<b;j+=i)
is_prime[j-a]=false;
}
}
for(ll i=0;i<b-a;i++) //统计个数 下标偏移
if(is_prime[i])
prime[prime_num++]=i+a;
}
int main()
{
ll a,b;
while (~scanf("%lld%lld",&a,&b))
{
prime_num=0;
memset(prime,0,sizeof(prime));
segment_sieve(a,b);
printf("%lld\n",prime_num);
}
return 0;
}