关于求解某数所有因子欧拉函数的复杂性分析
【命题】
对于给定数 \(n\) ,求解其所有因子的欧拉函数值
本文不讨论朴素做法,仅讨论两种较为常用的求解方法
【法一】
根据公式 \(\displaystyle \boldsymbol \varphi(n)=n\prod_{i=1}^m (1-{1\over p_i})\),其中 \(\displaystyle n=\prod_{i=1}^m p_i\)
对于 \(n\) 的每个因子 \(d\) ,暴力查询 \(\sqrt d\) 范围内的质因子,并筛除
最后核验 \(d\) 是否存在大于 \(\sqrt d\) 的质因子,若存在,则再计算该质因子贡献
复杂度为 \(O(\sqrt d)\)
int phid=d;
for(int i=2;i*i<=d;++i) if(d%i==0) {
while(d%i==0) d/=i;
phid=phid/i*(i-1);
}
if(d>1){
phid=phid/d*(d-1);
}
复杂度计算时,考虑 \(n\) 不大于 \(\sqrt n\) 的因子最多 \(\sqrt n\) 个,故不小于 \(\sqrt n\) 的因子与之成对出现,也不超过 \(\sqrt n\) 个
故每当出现 \(n\) 一个不大于 \(\sqrt n\) 的因子 \(d\) 时,我们对称考虑与它成对出现的因子 \({n\over d}\)
\(\displaystyle \quad T(n)\)
\(\displaystyle \leq\sum_{d=1}^{\sqrt n}(\sqrt d+\sqrt {n\over d})\)
\(\displaystyle =O(\int_1^{\sqrt n}\sqrt x\text dx)+\sqrt n\cdot O(\int_1^{\sqrt n}{1\over \sqrt x}\text dx)\)
\(\displaystyle =O(x^{3\over 2}|_1^{\sqrt n})+\sqrt n\cdot O(x^{1\over 2}|_1^{\sqrt n})\)
\(\displaystyle =O(n^{3\over 4})+O(n^{3\over 4})\)
\(\displaystyle =O(n^{3\over 4})\)
【法一优化】
由于复杂度计算时,不难发现,小于 \(\sqrt n\) 部分的因子和大于 \(\sqrt n\) 部分的因子复杂度贡献均为 \(O(n^{3\over 4})\)
根据质数定理的推论,\(n\) 范围内质数个数大约为 \({n\over \ln n}\)
故计算 \(n\) 的欧拉函数,仅需枚举 \(\sqrt n\) 范围内的质数,复杂度为 \(O({\sqrt n\over \ln\sqrt n})=O({\sqrt n\over \log n})\)
总求解复杂度如下:
\(\displaystyle \quad T(n)\)
\(\displaystyle \leq \sum_{d=1}^{\sqrt n}({\sqrt d\over \ln \sqrt d}+{\sqrt{n\over d}\over \ln \sqrt{n\over d}})\)
\(\displaystyle =O(\int_1^{\sqrt n}{2\sqrt x\over \ln x}\text dx)+O(\int_1^{\sqrt n}{2\sqrt {n\over x}\over \ln {n\over x}}\text d{n\over x})\)
\(\displaystyle =2\cdot O({1\over 3}\cdot \int_1^{\sqrt n} {\text dx^{3\over 2}\over \ln x^{3\over 2}})\)
\(\displaystyle =O(Li(({\sqrt n})^{3\over 2}))\)
\(\displaystyle =O(Li(n^{3\over 4}))\)
由于 \(\displaystyle \lim_{n\to +\infty} {Li(n)\over ({n\over \ln n})}=1\)
故 \(\displaystyle T(n)=O({n^{3\over 4}\over \ln n^{3\over 4}})=O({n^{3\over 4}\over \log n})\)
若额外考虑打出 \(m\) 范围内的欧拉函数值,显然 \(m\leq \sqrt n\) 时,对渐进复杂度无影响
当 \(m>\sqrt n\) 时,第二部分求解 \({n\over d}\) 时,上界修改为 \({n\over m}\)
故求解复杂度优化为 \(\displaystyle O(m+{({n\over m})^{3\over 2}\over \log {n\over m}})\),其中 \(O(m)\) 为欧拉筛复杂度
由于欧拉筛往往被视为预处理,当计算上述结果 \(k\) 次时,每次的均摊复杂度为 \(\displaystyle O({m\over k}+{({n\over m})^{3\over 2}\over \log {n\over m}})\)
由均值不等式,当且仅当 \(\displaystyle {m\over k}={({n\over m})^{3\over 2}\over \log {n\over m}}\) ,即约为 \(m=k^{2\over 5}\cdot n^{3\over 5}\) 时取最小
此时均摊复杂度约为 \(\displaystyle O({m\over k})=O(({n\over k})^{3\over 5})\) 达到最小
总复杂度约为 \(\displaystyle k\cdot O({m\over k})=O(k^{2\over 5}\cdot n^{3\over 5})\)
\(k=1\) 时取 \(m=n^{3\over 5}, T(n)\approx O(n^{3\over 5})\)
【法二】
考虑 \(n\) 的不同质因子数目,最坏情况下为 \(o(\log n)\) 的
\(n\geq 2\cdot 3\cdot 5\cdot 7\cdots p_m>2\cdot 2\cdot 2\cdot 2\cdots 2=2^m\to m<\log n\)
但均摊意义下,\(n\) 的不同质因子数目为 \(\displaystyle {1\over n}\sum_{i=1}^\infty \lfloor{n\over p_i}\rfloor\)
由埃氏筛的复杂性可得,均摊意义下,不同质因子数目为 \(O(\log \log n)\)
由于枚举 \(n\) 的所有因子时,其不同质因子均为 \(n\) 的不同质因子
故考虑先打出 \(n\) 的所有不同质因子,方法如上,复杂度为 \(O(\sqrt n)\) 或 \(O({\sqrt n\over \log n})\)
后续枚举 \(n\) 的因子时,同样成对枚举,并只使用该 \(o(\log n)\) 数量级的不同质因子去通过公式 \(\displaystyle \boldsymbol \varphi(n)=n\prod_{i=1}^m (1-{1\over p_i})\) 计算欧拉函数值
该部分复杂度为 \(O(\sqrt n)\cdot o(\log n)=o(\sqrt n\log n)\)
总复杂度为 \(O(\sqrt n)+o(\sqrt n\log n)=o(\sqrt n\log n)\) 或 \(O({\sqrt n\over \log n})+o(\sqrt n\log n)=o(\sqrt n\log n)\)
同理,均摊意义下为 \(O(\sqrt n\log\log n)\)
vector<int> divi;
inline void divit(int n){
divi.clear();
for(int i=2, I=sqrt(n)+1e-6;i<=I;++i) if(n%i==0) {
while(n%i==0) n/=i;
divi.push_back(i);
}
if(n>1)
divi.push_back(n);
}
inline int phi(int n){
int res=n;
for(auto p : divi)
if(n%p==0)
res=res/p*(p-1);
return res;
}
【总结】
关于法二与法一的复杂度比较,这里给出计算:
- 对于未优化的法一,若法二更优,则 \(\sqrt n\log n\leq n^{3\over 4}\),得出 \(\log n\leq n^{1\over 4}\)
由牛顿迭代计算得 \(n\geq 5503.6646890767315\) 。故在复杂度允许范围内,法二是普遍更优的
- 对于预处理质数的法一,若法二更优,则 \(\sqrt n\log n\leq {n^{3\over 4}\over \log n}\),得出 \(\log n\leq n^{1\over 8}\)
由牛顿迭代计算得 \(n\geq 214910065295.76816\approx 2^{31}\) 。故在 int 范围内,预处理质数的法一更优;int 边界时,两者复杂度相差较小;int 范围以外,法二更优
- 对于预处理欧拉函数的法一,考虑 \(k\) 远小于 \(n\) 时,若法二更优,则 \(\sqrt n\log n\leq n^{3\over 5}\),得出 \(\log n\leq n^{1\over 10}\)
由牛顿迭代计算得 \(n\geq 3430631121407792.0\approx 3.4\times 10^{15}\) 。故在复杂度允许的范围内,预处理欧拉函数的法一是普遍更优的
- 对于均摊意义下的法二与预处理欧拉函数的法一,考虑 \(k\) 远小于 \(n\) 时,若法二更优,则 \(\sqrt n\log\log n \leq n^{3\over 5}\),得出 \(\log \log n\leq n^{1\over 10}\)
这个等式是恒成立的。故在均摊意义下,法二快于法一。
【附录】
给出 \(n\) 以内不同质因子个数 \(m\) 的范围:
|\(n\)|\(10^1\)|\(10^2\)|\(10^3\)|\(10^4\)|\(10^5\)|\(10^6\)|\(10^7\)|\(10^8\)|\(10^9\)|\(10^{10}\)|\(10^{11}\)|\(10^{12}\)|\(10^{13}\)|\(10^{14}\)|\(10^{15}\)|\(10^{16}\)|\(10^{17}\)|\(10^{18}\)|\(10^{19}\)|
|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|
|\(m\)|\(2\)|\(3\)|\(4\)|\(5\)|\(6\)|\(7\)|\(8\)|\(8\)|\(9\)|\(10\)|\(10\)|\(11\)|\(12\)|\(12\)|\(13\)|\(13\)|\(14\)|\(15\)|\(15\)|
可以发现,在复杂度允许范围内,答案与 \(\lg n\) 较为接近