筛法求素数的最优算法＋解释

筛法求素数：

求n内的素数。先用2去筛，即把2留下，把2的倍数剔除掉；再用下一个质数，也就是3筛，把3留下，把3的倍数剔除掉；接下去用下一个质数5筛，把5留下，把5的倍数剔除掉；不断重复下去……。

由此，我们可以写出基础版的筛法求素：

const int maxn = 102410240;
bool isp[maxn];
void init()
{
    memset(isp, true, sizeof(isp));
    isp[0] = isp[1] = false;
    const int max1 = sqrt(maxn + 0.5);
    for(int i = 2; i <= max1; i++)
        if(isp[i])
            for(int j = i * i; j < maxn; j += i)
                isp[j] = false;
}

经过测试，计算1亿以内的素数大概要2.7s多。

但是我们发现这个算法有可以优化的地方，因为有很多合数被重复标记。

比如40 被质数2,5各标记了一次

下面这种优化版的算法可以把所有数只标记一次，令算法接近O(n)

const int maxn = 102410240;
bool not_prime[maxn];
int prime[maxn/2], cnt;

void init()
{
    memset(not_prime, 0, sizeof(not_prime));
    for (int i = 2; i < maxn; i++) {
        if (!not_prime[i]) prime[cnt++] = i;  //位置1
        for (int j = 0; j < cnt && i * prime[j] < maxn; j++) {
            not_prime[i * prime[j]] = 1;      //位置2
            if (!(i % prime[j])) break;       //位置3
        }
    }
    
}

经过测试，求1亿以内的素数只要1.43秒

可以看到，比基础版的快了将近一倍（我的小mac运行速度本来就不快）

解释：

那么这个算法是如何做到保证每个数字只被标记一次的？

我这里粗略的解释一下我是如何理解它的：

对于所有大于1的整数，分为质数（素数）和合数这两种。

合数又可以分为两种：

1. 由1个质数和另1个质数组成

2. 由2个以上质数组成 ---> 把它进一步看成：由1个质数和1个合数组成

在位置1我们可以得到所有的质数，相信这个我就不用解释了。

在位置2我们标记所有的合数：

在位置2的时候一共由两种可能：

1. i为质数，prime[j]为质数

可以看到正好符合了合数的第一种，所以所有的第一种合数会被标记

2. i为合数，prime[j]为质数

正好符合合数的第二种，所有第二种合数会被标记

ok, 我们现在知道了这个算法会把所有合数标记出来，那么它是如果不重复标记的？

依靠位置3

因为任意一个合数a可以拆成一个比它小的质数b乘以一个比它小的合数c(强调“比它小”)

所以在i < a 的时候，一定有存在一个时间点是i等于c，且prime[j]等于b,且这一组合是唯一的，

那么当它们标记完之后就要退出。因为每一个合数都有一组唯一的a, b,这样就保证了这个算法的不重不漏。

posted @ 2015-11-12 06:16 BowenCCC~ 阅读(1603) 评论(0) 收藏举报

刷新页面返回顶部

BowenCCC~

Keep Coding

筛法求素数的最优算法＋解释

筛法求素数：

求n内的素数。先用2去筛，即把2留下，把2的倍数剔除掉；再用下一个质数，也就是3筛，把3留下，把3的倍数剔除掉；接下去用下一个质数5筛，把5留下，把5的倍数剔除掉；不断重复下去……。

由此，我们可以写出基础版的筛法求素：

经过测试，计算1亿以内的素数大概要2.7s多。

但是我们发现这个算法有可以优化的地方，因为有很多合数被重复标记。

比如40 被质数2,5各标记了一次

下面这种优化版的算法可以把所有数只标记一次，令算法接近O(n)

经过测试，求1亿以内的素数只要1.43秒

可以看到，比基础版的快了将近一倍（我的小mac运行速度本来就不快）

解释：

那么这个算法是如何做到保证每个数字只被标记一次的？

我这里粗略的解释一下我是如何理解它的：

对于所有大于1的整数，分为质数（素数）和合数这两种。

合数又可以分为两种：

1. 由1个质数和另1个质数组成

2. 由2个以上质数组成 ---> 把它进一步看成：由1个质数和1个合数组成

在位置1我们可以得到所有的质数，相信这个我就不用解释了。

在位置2我们标记所有的合数：

在位置2的时候一共由两种可能：

1. i为质数，prime[j]为质数

可以看到正好符合了合数的第一种，所以所有的第一种合数会被标记

2. i为合数，prime[j]为质数

正好符合合数的第二种，所有第二种合数会被标记

ok, 我们现在知道了这个算法会把所有合数标记出来，那么它是如果不重复标记的？

依靠位置3

因为任意一个合数a可以拆成一个比它小的质数b乘以一个比它小的合数c(强调“比它小”)

所以在i < a 的时候，一定有存在一个时间点是i等于c，且prime[j]等于b,且这一组合是唯一的，

那么当它们标记完之后就要退出。因为每一个合数都有一组唯一的a, b,这样就保证了这个算法的不重不漏。

公告

BowenCCC~

Keep Coding

筛法求素数的最优算法＋解释

筛法求素数：

求n内的素数。先用2去筛，即把2留下，把2的倍数剔除掉；再用下一个质数，也就是3筛，把3留下，把3的倍数剔除掉；接下去用下一个质数5筛，把5留下，把5的倍数剔除掉；不断重复下去……。

由此，我们可以写出基础版的筛法求素：

经过测试，计算1亿以内的素数大概要2.7s多。

但是我们发现这个算法有可以优化的地方，因为有很多合数被重复标记。

比如40 被 质数2,5各标记了一次

下面这种优化版的算法可以把所有数只标记一次，令算法接近O(n)

经过测试，求1亿以内的素数只要1.43秒

可以看到，比基础版的快了将近一倍（我的小mac运行速度本来就不快）

解释：

那么这个算法是如何做到保证每个数字只被标记一次的？

我这里粗略的解释一下我是如何理解它的：

对于所有大于1的整数，分为质数（素数）和合数这两种。

合数又可以分为两种：

1. 由1个质数和另1个质数组成

2. 由2个以上质数组成 ---> 把它进一步看成：由1个质数和1个合数组成

在位置1我们可以得到所有的质数，相信这个我就不用解释了。

在位置2我们标记所有的合数：

在位置2的时候一共由两种可能：

1. i为质数，prime[j]为质数

可以看到正好符合了合数的第一种，所以所有的第一种合数会被标记

2. i为合数，prime[j]为质数

正好符合合数的第二种，所有第二种合数会被标记

ok, 我们现在知道了这个算法会把所有合数标记出来，那么它是如果不重复标记的？

依靠位置3

因为任意一个合数a可以拆成一个比它小的质数b乘以一个比它小的合数c(强调“比它小”)

所以在i < a 的时候，一定有存在一个时间点是i等于c，且prime[j]等于b,且这一组合是唯一的，

那么当它们标记完之后就要退出。因为每一个合数都有一组唯一的a, b,这样就保证了这个算法的不重不漏。

公告

比如40 被质数2,5各标记了一次