[hdu5901]Count primes

最简单的是利用Min25筛求$h(n)$的过程,即

 1 #include<bits/stdc++.h>
 2 using namespace std;
 3 #define N 1000005
 4 #define ll long long
 5 int K,vis[N],P[N],h[N<<1];
 6 ll n;
 7 int id(ll k){
 8     if (k<=K)return k;
 9     return 2*K+1-n/k;
10 }
11 ll get(int k){
12     if (k<=K)return k;
13     return n/(2*K+1-k);
14 }
15 void init(int K){
16     for(int i=2;i<=K;i++){
17         if (!vis[i])P[++P[0]]=i;
18         for(int j=1;(j<=P[0])&&(i*P[j]<=K);j++){
19             vis[i*P[j]]=1;
20             if (i%P[j]==0)break;
21         }
22     }
23 }
24 int main(){
25     init(N-5);
26     while (scanf("%lld",&n)!=EOF){
27         K=(int)sqrt(n);
28         for(int i=1;i<=2*K;i++)h[i]=get(i);
29         for(int i=1;P[i]<=K;i++)
30             for(int j=2*K;(j)&&(1LL*P[i]*P[i]<=get(j));j--)h[j]-=h[id(get(j)/P[i])]-h[id(P[i]-1)];
31         printf("%lld\n",h[id(n)]-1);
32     }
33 } 
View Code

事实上,还可以进一步优化

定义$Min(i)$为$i$的最小素因子(特别的,$Min(1)=\infty$),$Max(i)$为$i$的最大素因子,$p_{i}$为从小到大第$i$个素数,$\pi_{k}(n)=\sum_{p_{i}\le n}p_{i}^{k}$(本题中$k=0$,但由于$k$并不影响下述算法,因此以下设$k$为较小的常数)

记$cnt(x)$为$x$的可重素因子个数,具体来说,满足:

1.$cnt(1)=0$,$\forall p_{i},cnt(p_{i})=1$

2.$\forall x,y>0,cnt(xy)=cnt(x)+cnt(y)$

选择一个素数$p_{B}$,满足$p_{B}^{3}\ge N$且$p_{B}^{2}\le N$,关于$P_{B}$最为合适的值以后再分析

定义$\phi_{s}(n,m)=\sum_{1\le i\le n,p_{m}<Min(i),cnt(i)=s}i^{k}$,$\phi(n,m)=\sum_{s}\phi_{s}(n,m)$

当$p_{m+1}^{s}>n$时有$\phi_{s}(n,m)=0$,因此,不难得到有$\phi(N,B)=\sum_{s=0}^{2}\phi_{s}(N,B)$,分别考虑这三项,又有
$$
\phi(N,B)=1+(\pi_{k}(N)-\pi_{k}(P_{B}))+\phi_{2}(N,B)
$$
简单移项,又有
$$
\pi_{k}(N)=\pi_{k}(P_{B})-\phi_{2}(N,B)+\phi(N,B)-1
$$
关于$\pi_{k}(P_{B})$可以$o(P_{B})$的求出,$\phi_{2}(N,B)$不妨暴力枚举具体的两个素数,即
$$
\phi_{2}(N,B)=\sum_{B<i\le j,p_{i}p_{j}\le N}(p_{i}p_{j})^{k}=\sum_{B<i}p_{i}^{k}\sum_{i\le j,p_{i}\cdot p_{j}\le N}p_{j}^{k}
$$
由于$i>B$,后者即$\pi_{k}$的前缀和差分,用$o(\frac{N}{P_{B}})$的复杂度预处理,同时$p_{i}^{2}\le N$,关于$i$的枚举即$o(\sqrt{N})$

$\phi(n,m)$的计算-递推

类似前面关于$\phi(n,m)$的计算,不难得到$\phi(n,m)=\phi(n,m-1)-p_{m}^{k}\phi(\lfloor\frac{n}{p_{m}}\rfloor,m-1)$

考虑递归计算,那么就构成了一棵满二叉树,更具体的,有:

1.用二元组表示一个节点,通常记作$(x,h)$($h\ge 0$),根为$(1,m)$,且边有边权

2.对于$(x,h)$的状态,分类讨论——

(1)若$h=0$,则$(x,h)$的为叶子;

(2)若$h>0$,则$(x,h)$的左儿子为$(x,h-1)$,边权为1,右儿子为$(x\cdot p_{h},h-1)$,边权为$-p_{h}^{k}$

定义$(x,h)$的权值为其到根路径上所有边边权乘积$\times \phi(\lfloor\frac{n}{x}\rfloor,h)$,根据$\phi$的递推式,一个点的权值即为其两个儿子的权值和(都乘了一个$x$到根的系数)

根据这个,我们只需要选择若干个节点,使得每一个叶子到根路径上恰有一个节点被选择,那么不难证明根节点的权值即为所有选择的节点权值和

下面,我们构造一种选择方式,并简单证明一下这样选择的正确性——

选择$(x,h)$当且仅当$h=0$且$x\le p_{B}$,或$p_{B}<x\le p_{B}\cdot Min(x)$且$p_{h+1}=Min(x)$

根据前面,也就是要求叶子到根的路径恰好存在一个节点被选择

从构造树的过程,可以发现:对于一个非根节点$(x,h)$,若$p_{h+1}=Min(x)$则其父亲为$(\frac{x}{Min(x)},h+1)$,否则为$(x,h+1)$

1.对于$(x,0)$(其中$x\le p_{B}$),首先其必然直接被选择,同时对于其到祖先的链上节点权值必然因此不大于$x$即不大于$p_{B}$,不可能有其余点被选

2.对于$(x,0)$(其中$x>p_{B}$),不断向上找到其中第一个节点$y$使得$y$的父亲不超过$p_{B}$,由于$y$的父亲要比$y$小(否则$y$的儿子也可以),那么$y$的父亲即$\frac{y}{Min(y)}$,那么$p_{h+1}=Min(y)$

同时,$y$自己是可以的,因此就得到了$p_{B}<y\le p_{B}\cdot Min(y)$

对于这个右儿子的父亲以上的节点与第一点相同,都不超过$p_{B}$,右儿子以下的节点中分类讨论:

(1)若等于$y$,那么$h$减小,不满足$p_{h+1}=Min(y)$

(2)若不等于$y$(大于),记作$z$,来考虑第一个比其小的祖先,其权值不小于$y$(否则可以选$y$),不难证明这个节点就是$\frac{z}{Min(z)}\ge y>p_{B}$,不符合条件

接下来,考虑一个$x$所对应的系数:首先,每一次乘上素数$p$都有一个$p^{k}$,总共即为$x^{k}$,符号取决于素因子个数,恰好是$\mu(x)$

另外还有$x$的条件,在上面的基础上,我们还需要保证$(x,h)$这个节点会出现,即$Max(x)\le p_{m}$以及$x$中不含有素数平方的因子,后者由于$\mu(x)$恰好为0,可以不判定

更具体的,有下式
$$
\phi(n,m)=\sum_{1\le x\le p_{B},Max(x)\le p_{m}}\mu(x)x^{k}\phi(\lfloor\frac{n}{x}\rfloor,0)+\sum_{p_{B}<x\le p_{B}\cdot Min(x),Max(x)\le p_{m}}\mu(x)x^{k}\phi(\lfloor\frac{n}{x}\rfloor,\pi(Min(x))-1)
$$

$\phi(n,m)$的计算-分类

关于$\phi(n,0)=\sum_{i=1}^{n}i^{k}$不难推导出通项公式,因此前者可以$o(p_{B})$计算

进一步的,将后者拆分,先枚举$p_{m'}=Min(x)$,即
$$
-\sum_{m'=1}^{m}p_{m'}^{k}\sum_{x\le p_{B}<x\cdot p_{m'},Min(x)>p_{m'},Max(x)\le p_{m}}\mu(x)x^{k}\phi(\lfloor\frac{n}{x\cdot p_{m'}}\rfloor,m'-1)
$$
具体代入,所求的是$\phi(N,B)$,即
$$
-\sum_{m'=1}^{B}p_{m'}^{k}\sum_{x\le p_{B}<x\cdot p_{m'},Min(x)>p_{m'}}\mu(x)x^{k}\phi(\lfloor\frac{N}{x\cdot p_{m'}}\rfloor,m'-1)
$$
分为三类来计算——

1.当$p_{m'}^{2}\le p_{B}$,此时对于后面的状态,由于$\lfloor\frac{n}{x\cdot p_{m'}}\rfloor\in S_{n}$,可以在$o(\frac{\sqrt{p_{B}N}}{\log n})$的时间内预处理出来(根据$\phi(n,m)=\phi(n,m-1)-p_{m}^{k}\phi(\lfloor\frac{n}{p_{m}}\rfloor,m-1)$来计算)

再以$o(\frac{p_{B}\sqrt{p_{B}}}{\log p_{B}})$的复杂度枚举$m'$和$x$,总复杂度即为$o(\frac{\sqrt{p_{B}N}}{\log N})$(枚举$m'$和$x$的复杂度较小)

2.当$p_{m'}^{2}>p_{B}$,此时考虑$x\le p_{B}$且$Min(x)>p_{m'}$,不难发现$cnt(x)<2$,即$x$为素数或是1,后者显然不满足$p_{B}<x\cdot p_{m'}$,因此$x$为素数

接下来,原式即
$$
\sum_{m'\le B,p_{m'}^{2}> p_{B}}p_{m'}^{k}\sum_{x=m'+1}^{B}p_{x}^{k}\phi(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)
$$
$\phi(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)=\sum_{s}\phi_{s}(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)$,又有当$\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor<p^{s}_{m'}$时为0,那么考虑令$s$只能为0来缩小$p_{m'}$的范围,即$p_{x}\cdot p_{m'}^{2}>N$,又因为$p_{x}>p_{m'}$,放缩为$p_{m'}^{3}>N$

此时该式即为$\phi_{0}(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)=[N\ge p_{x}\cdot p_{m'}]$,又因为$p_{B}^{2}\le N$,恒为1,即
$$
\sum_{m'\le B,p_{m'}^{3}>N}p_{m'}^{k}\sum_{m'<x\le B}p_{x}^{k}
$$
对$m'$用$o(B)$枚举,后面即一个$\pi_{k}$的前缀和差分,预处理即可,总复杂度为$o(B)$

3.$p_{m'}^{2}>p_{B}$且$p_{m'}^{3}\le N$,仍然有$x$为素数,与第二部分的第一个式子相同,即
$$
\sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}\le N}p_{m'}^{k}\sum_{m'<x\le B}p_{x}^{k}\phi(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)
$$
这一类比较难算,回顾$\phi(\lfloor\frac{N}{p_{x}\cdot p_{m'}}\rfloor,m'-1)$的定义,由于$cnt(x)$是任意的,即在$\phi_{s}(n,m)$的基础上去掉$s$的限制即可,将其代入即
$$
\sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}\le N}p_{m'}^{k}\sum_{x=m'+1}^{B}p_{x}^{k}\sum_{q\cdot p_{x}\cdot p_{m'}\le N,Min(q)\ge p_{m'}}q^{k}
$$
调换$x$和$q$的枚举顺序,即
$$
\sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}\le N}p_{m'}^{k}\sum_{q\cdot p_{m'}^{2}\le N,Min(q)\ge p_{m'}}q^{k}\sum_{m'<x\le B,q\cdot p_{x}\cdot p_{m'}\le N}p_{x}^{k}
$$
关于这件事情的计算方式:

先枚举$m'$,之后对$\lfloor\frac{N}{p_{m'}}\rfloor$数论分块,通过$m'$和$\lfloor\frac{N}{q\cdot p_{m'}}\rfloor$显然可以确定$x$这一维度的和($o(B)$预处理),接下来也就是求区间内有多少给$q$满足$Min(q)\ge p_{m'}$

由于$p_{m'}^{2}>p_{B}$,即$q\cdot p_{B}\le N$,可以预处理出每一个$q$的$Min(q)$,并从大到小枚举$m'$,加入对应的$q$,再用树状数组来维护即可

时间复杂度上,对$m'$的枚举是$o(\frac{N^{\frac{1}{3}}}{\log N})$,接下来数论分块是$\sqrt{\frac{N}{p_{m'}}}$,将其求和即
$$
\sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}\le N}\sqrt{\frac{N}{p_{m'}}}=\sqrt{N}\sum_{1\le i^{3}\le N}(\pi(i)-\pi(i-1))i^{-\frac{1}{2}}
$$
根据素数定理,即$\pi(n)=o(\frac{n}{\log n})$,代入后即为
$$
\frac{\sqrt{N}}{\log N}\sum_{1\le i\le N^{\frac{1}{3}}}i^{-\frac{1}{2}}=\frac{\sqrt{N}}{\log N}\int_{1}^{N^{\frac{1}{3}}}i^{-\frac{1}{2}}=\frac{N^{\frac{2}{3}}}{\log N}
$$
之后还有一个树状数组,总复杂度为$o(N^{\frac{2}{3}})$,理论上优于$o(\frac{N^{\frac{3}{4}}}{\log N})$

同时,对于其修改总复杂度为$o(\frac{N\log N}{p_{B}})$,这取决于需要插入的$q$数量

$\phi(n,m)$的计算-优化

发现复杂度的瓶颈在于第三部分,考虑再对$q$分类讨论:

1.若$q=1$,即为
$$
\sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}\le N}p_{m'}^{k}\sum_{m'<x\le B}p_{x}^{k}
$$
随便维护一下,复杂度为$o(\frac{N^{\frac{1}{3}}}{\log N})$

2.若$q$是素数,则即要求$q\ge p_{m'}$,这个就不需要用树状数组维护,即$o(\frac{N^{\frac{2}{3}}}{\log N})$

3.若$q$不是素数,即$q\ge Min(q)^{2}\ge p_{m'}^{2}$,即$p_{m'}^{4}\le N$,此时询问复杂度类似于前面是$o(N^{\frac{5}{8}})$

对于修改的复杂度,事实上是$o(\frac{N}{p_{B}})$的,以下来证明:

首先,有这样一个性质$\forall s\ge 1,\sum_{i=1}^{n}[cnt(i)=s]=o(\frac{n}{\log n})$

证明考虑归纳,$s=1$即素数定理,$s>1$时有
$$
\sum_{i=1}^{n}[cnt(i)=s]=\sum_{p_{i}\le n}\sum_{1\le j\le \lfloor\frac{n}{p_{i}}\rfloor}[cnt(j)=s-1]=\frac{\sum_{p_{i}\le n}{\lfloor\frac{n}{p_{i}}}\rfloor}{\log n}
$$
对于分子简单来看,就是调和级数*素数的概率,后者根据素数定理即$o(\frac{1}{\log n})$,总共即$o(n)$(更精确的来说是埃氏筛的复杂度,即为$o(n\log\log n)$,这里就简单看作$o(n)$了)

那么即证明了对于$s>1$,对应的个数也是$o(\frac{n}{\log n})$的

事实上,这件事情的正确理解方式应该是对于任意$s$,总存在足够大的$n$,使得此时$cnt(i)=s$的数量大约为$o(\frac{n}{\log n})$的的级别

考虑$p_{B}^{3}\ge N$,且$Min(q)^{2}\ge p_{m'}^{2}>p_{B}$,有$Min(q)^{6}\ge N$,因此$cnt(q)\le 6$,数量为$o(\frac{N}{p_{B}\log N})$(由于$N$并不足够大,这里的范围实际更接近$o(\frac{N}{p_{B}})$),算上树状数组后即$o(\frac{N}{p_{B}})$

时间复杂度

综合上述,复杂度包含——

0.线性筛,$o(\frac{N}{p_{B}})$预处理出素数(个数)、$\mu(i)$、$\pi_{k}(i)$、$Min(i)$和$Max(i)$($i\cdot p_{B}\le N$)

1.$o(1)$求出$\pi_{k}(p_{B})$

2.$o(\sqrt{N})$求出$\phi_{2}(N,B)$

3.$o(\frac{\sqrt{p_{B}N}}{\log N})$求出$\phi(N,B)$的第一部分

4.$o(B)$求出$\phi(N,B)$的第二部分

5.$o(\frac{N^{\frac{2}{3}}}{\log N}+N^{\frac{5}{8}}+\frac{N}{p_{B}})$求出$\phi(N,B)$的第三部分

关于$p_{B}$的取值考虑$o(\frac{\sqrt{p_{B}N}}{\log N})$和$o(\frac{N}{p_{B}})$,相等即解出$p_{B}=N^{\frac{1}{3}}\log^{\frac{2}{3}}N$,总时间复杂度为$o((\frac{N}{\log N})^{\frac{2}{3}})$

空间复杂度与时间复杂度相同,也为$o((\frac{N}{\log N})^{\frac{2}{3}})$,劣于$o(\sqrt{N})$的空间复杂度

具体实现中,这个算法的时间相比$o(\frac{N^{\frac{3}{4}}}{\log N})$的算法有较大的改善,但会被卡空间

  1 #include<bits/stdc++.h>
  2 using namespace std;
  3 #define N 3000005
  4 #define ll long long
  5 vector<int>v[N];
  6 int K,B,P[N],vis[N],pi[N],mu[N],Min[N],Max[N],f[N];
  7 ll n,ans,h[N];
  8 ll sqr(int k){
  9     return 1LL*k*k;
 10 }
 11 ll cube(int k){
 12     return 1LL*k*k*k;
 13 }
 14 int id(ll k){
 15     if (k<=K)return k;
 16     return 2*K+1-n/k;
 17 }
 18 ll get(int k){
 19     if (k<=K)return k;
 20     return n/(2*K+1-k);
 21 }
 22 void init(int K){
 23     mu[1]=1;
 24     for(int i=2;i<=K;i++){
 25         pi[i]=pi[i-1];
 26         if (!vis[i]){
 27             P[++P[0]]=i;
 28             mu[i]=-1;
 29             pi[i]++;
 30             Min[i]=Max[i]=i;
 31         }
 32         for(int j=1;(j<=P[0])&&(i*P[j]<=K);j++){
 33             vis[i*P[j]]=1;
 34             Min[i*P[j]]=P[j];
 35             Max[i*P[j]]=Max[i];
 36             if (i%P[j])mu[i*P[j]]=-mu[i];
 37             else{
 38                 mu[i*P[j]]=0;
 39                 break;
 40             }
 41         }
 42     }
 43 }
 44 int lowbit(int k){
 45     return (k&(-k));
 46 }
 47 void update(int k){
 48     while (1LL*k*P[B]<=n){
 49         f[k]++;
 50         k+=lowbit(k);
 51     }
 52 }
 53 int query(int k){
 54     int ans=0;
 55     while (k>0){
 56         ans+=f[k];
 57         k-=lowbit(k);
 58     }
 59     return ans;
 60 }
 61 int query(int l,int r){
 62     return query(r)-query(l-1);
 63 }
 64 int main(){
 65     init(N-5);
 66     while (scanf("%lld",&n)!=EOF){
 67         K=3e6;
 68         if (n<=K){
 69             printf("%d\n",pi[n]);
 70             continue;
 71         } 
 72         int pB=(int)pow(n*pow(log(n),2),1.0/3);
 73         for(int i=1;i<=P[0];i++)
 74             if (P[i]>=pB){
 75                 B=i;
 76                 break;
 77             }
 78         ans=pi[P[B]]-1;
 79         for(int i=B+1,j=P[0];sqr(P[i])<=n;i++){
 80             while (1LL*P[i]*P[j]>n)j--;
 81             ans-=pi[P[j]]-pi[P[i]-1];
 82         }
 83         for(int i=1;i<=P[B];i++)ans+=mu[i]*(n/i);
 84         K=(int)sqrt(n);
 85         for(int i=1;i<=2*K;i++)h[i]=get(i);
 86         for(int i=1;sqr(P[i])<=P[B];i++){
 87             for(int j=1;j<=P[B];j++)
 88                 if ((P[B]<1LL*j*P[i])&&(Min[j]>P[i]))ans-=mu[j]*h[id(n/P[i]/j)];
 89             for(int j=2*K;j;j--)h[j]-=h[id(get(j)/P[i])];
 90         }
 91         for(int i=B;cube(P[i])>n;i--)ans+=pi[P[B]]-pi[P[i]];
 92         int l=0,r=0;
 93         for(int i=1;i<=B;i++){
 94             if ((!l)&&(sqr(P[i])>P[B]))l=i;
 95             if (cube(P[i])<=n)r=i;
 96         }
 97         for(int i=l;i<=r;i++)ans+=B-i;
 98         for(int i=l;i<=r;i++){
 99             ll nn=n/P[i];
100             for(ll x=P[i],y;P[i]<nn/x;x=y+1){
101                 y=nn/(nn/x);
102                 ans+=1LL*(pi[y]-pi[x-1])*(pi[min(nn/x,(ll)P[B])]-pi[P[i]]);
103             }
104         }
105         memset(f,0,sizeof(f));
106         for(int i=1;i<=B;i++)
107             if (sqr(sqr(P[i]))<=n)r=i;
108         for(int i=1;i<=P[0];i++)v[P[i]].clear();
109         for(int i=1;1LL*i*P[B]<=n;i++)
110             if (vis[i]){
111                 if (Min[i]>P[r])update(i);
112                 else v[Min[i]].push_back(i);
113             }
114         for(int i=r;i>=l;i--){
115             for(int j=0;j<v[P[i]].size();j++)update(v[P[i]][j]);
116             ll nn=n/P[i];
117             for(ll x=1,y;P[i]<nn/x;x=y+1){
118                 y=nn/(nn/x);
119                 ans+=1LL*query(x,y)*(pi[min(nn/x,(ll)P[B])]-pi[P[i]]);
120             }
121         }
122         printf("%lld\n",ans);
123     }
124 }
View Code

 

posted @ 2021-02-09 17:32  PYWBKTDA  阅读(132)  评论(0编辑  收藏  举报