筛法求素数的最优算法+解释

 

 

筛法求素数:

求n内的素数。先用2去筛,即把2留下,把2的倍数剔除掉;再用下一个质数,也就是3筛,把3留下,把3的倍数剔除掉;接下去用下一个质数5筛,把5留下,把5的倍数剔除掉;不断重复下去……。

由此,我们可以写出基础版的筛法求素:

const int maxn = 102410240;
bool isp[maxn];
void init()
{
    memset(isp, true, sizeof(isp));
    isp[0] = isp[1] = false;
    const int max1 = sqrt(maxn + 0.5);
    for(int i = 2; i <= max1; i++)
        if(isp[i])
            for(int j = i * i; j < maxn; j += i)
                isp[j] = false;
}

经过测试,计算1亿以内的素数大概要2.7s多。

但是我们发现这个算法有可以优化的地方,因为有很多合数被重复标记。

 

比如40 被 质数2,5各标记了一次

下面这种优化版的算法可以把所有数只标记一次,令算法接近O(n)

const int maxn = 102410240;
bool not_prime[maxn];
int prime[maxn/2], cnt;

void init()
{
    memset(not_prime, 0, sizeof(not_prime));
    for (int i = 2; i < maxn; i++) {
        if (!not_prime[i]) prime[cnt++] = i;  //位置1
        for (int j = 0; j < cnt && i * prime[j] < maxn; j++) {
            not_prime[i * prime[j]] = 1;      //位置2
            if (!(i % prime[j])) break;       //位置3
        }
    }
    
}

 

经过测试,求1亿以内的素数只要1.43秒

可以看到,比基础版的快了将近一倍(我的小mac运行速度本来就不快)

 


 

解释:

那么这个算法是如何做到保证每个数字只被标记一次的?

 

我这里粗略的解释一下我是如何理解它的:

 

对于所有大于1的整数,分为质数(素数)和合数这两种。  

合数又可以分为两种:

1. 由1个质数和另1个质数组成

2. 由2个以上质数组成 --->  把它进一步看成:由1个质数和1个合数组成

 

在位置1我们可以得到所有的质数,相信这个我就不用解释了。

在位置2我们标记所有的合数:

在位置2的时候一共由两种可能:

1. i为质数,prime[j]为质数

可以看到正好符合了合数的第一种,所以所有的第一种合数会被标记

2. i为合数,prime[j]为质数

正好符合合数的第二种,所有第二种合数会被标记

ok, 我们现在知道了这个算法会把所有合数标记出来,那么它是如果不重复标记的?

依靠位置3

 

因为任意一个合数a可以拆成一个比它小的质数b乘以一个比它小的合数c(强调“比它小”)

所以在i < a 的时候,一定有存在一个时间点是i等于c,且prime[j]等于b,且这一组合是唯一的,

那么当它们标记完之后就要退出。因为每一个合数都有一组唯一的a, b,这样就保证了这个算法的不重不漏。

 

 

 

 

posted @ 2015-11-12 06:16  BowenCCC~  阅读(1529)  评论(0编辑  收藏  举报