数学/数论专题-学习笔记:莫比乌斯反演
一些 update
Update 2022/3/4:发现莫比乌斯反演中第二个式子推导时卷积式有误,导致结论错误,现已更正。
1. 前言
莫比乌斯函数与莫比乌斯反演是数论中的重要部分。
在一般做题的时候,需要整除分块,狄利克雷卷积,杜教筛等知识,以及根据不同的题目还会结合不同的算法。
莫比乌斯反演也有个简称叫莫反,后文会使用这个简称。
全文前置知识:整除分块,狄利克雷卷积。
2. 莫比乌斯函数
莫比乌斯函数的符号是 \(\mu(n)\),定义域是 \(\text{N}_+\),值域是 \(\{0,1,-1\}\),这个式子的计算方式如下:
- 定义 \(\mu(1)=1\)。
- 对于 \(n \ge 2\),如果 \(n\) 能表示成 \(\prod_{i=1}^k p_i\) 的形式,其中所有 \(p_i\) 都是质数,即分解质因数后指数均为 1,那么 \(\mu(n)=(-1)^k\),否则 \(\mu(n)=0\)。
从中可以发现,莫比乌斯函数类似于容斥系数。
另外的,莫比乌斯函数还有一种定义方式,是根据狄利克雷卷积得到的:\(I*\mu=\epsilon\)。
\(I\) 是常数函数,\(\epsilon\) 是单位函数,\(I(n)=1,\epsilon(n)=[n=1]\)。
因此上述的计算方式也是根据这个式子得到的。
性质:莫比乌斯函数是积性函数,即证明 \(\forall\gcd(i,j)=1,\mu(i) \times \mu(j)=\mu(i \times j)\)。
一个函数 \(f(n),n \in \text{N}_+\) 是积性函数的充要条件是 \(\forall\gcd(i,j)=1,f(i) \times f(j)=f(i \times j)\)
证明:首先如果 \(i,j\) 中至少一个等于 1,原式必定成立。
对于所有 \(i,j \ge 2\),设 \(i=\prod_{t=1}^{s_1}p_{1,t}^{k_{1,t}},j=\prod_{t=1}^{s_2}p_{2,t}^{k_{2,t}}\),其中 \(p_{n,m}\) 为质数,也就是分解质因数。
若 \(\mu(i)\) 与 \(\mu(j)\) 有至少一个为 0,也就说明所有 \(k_{n,m}\) 中有一个大于等于 2,因此 \(i \times j\) 也必然存在一个质数,其指数大于等于 2,则 \(\mu(i \times j)=0\),故原式成立。
若 \(\mu(i) \ne 0,\mu(j) \ne 0\),由于 \(\gcd(i,j)=1\),则所有 \(p_{n,m}\) 互不相同,也就是没有两个分解出来的质数是相同的,因此可以证明 \(i \times j\) 分解质因数之后没有一个质数,其指数大于等于 2。
现在可以将 \(i,j\) 化成这样:\(i=\prod_{t=1}^{s_1}p_{1,t},j=\prod_{t=1}^{s_2}p_{2,t}\),则 \(i \times j=\prod_{t=1}^{s}p_t\),其中 \(s=s_1+s_2\),\(p_t\) 是由 \(p_{1,t}\) 和 \(p_{2,t}\) 并上的数列。
根据定义,\(\mu(i)=(-1)^{s_1},\mu(j)=(-1)^{s_2},\mu(i \times j)=(-1)^{s_1+s_2}=\mu(i) \times \mu(j)\),证毕。
既然 \(\mu(n)\) 是积性函数,那么我们可以线性筛求解 \([1,n]\cap\text{N}_+\) 内所有的 \(\mu(i)\)。
Code:
void init()
{
mu[1] = 1; book[1] = 1; // 初始化
for (int i = 2; i <= n; ++i)
{
if (!book[i]) { Prime[++Prime[0]] = i; mu[i] = -1; }
// 质数默认为 -1
for (int j = 1; j <= Prime[0]; ++j)
{
if (i * Prime[j] > n) break ;
book[i * Prime[j]] = 1;
if (i % Prime[j] == 0) { mu[i * Prime[j]] = 0; break ; }
// 出现指数大于等于 2 的质数
mu[i * Prime[j]] = -mu[i];
// 考虑到 Prime[j] 自己是质数,因此直接转化成 -mu[i]
}
}
}
3. 莫比乌斯反演
再次说明:下文中莫反是莫比乌斯反演的简称。
首先证明一个性质:\(\forall n \in \text{N}_+,[n=1]=\sum_{d\mid n}\mu(d)\)。
\([A]\) 表示当 \(A\) 成立时值为 1,否则值为 0。
法一证明:
首先单独考虑 \(n=1\) 的情况,此时带回原式验证发现等式显然成立。
对于 \(n \ge 1\) 的情况,分解质因数,\(n=\prod_{i=1}^{s}p_i^{k_i},d=\prod_{i=1}^{s'}p'_i\),这里不给 \(d\) 加指数的原因是对于指数大于等于 2 的数其 \(\mu\) 为 0。
发现此时计算 \(\mu(d)\) 就变成了一个组合问题,从 \(s\) 个质数中选出 \(s'\) 个方案数 \(C_{s}^{s'}\),而这一块的 \(\mu\) 是 \((-1)^{s'}\),特别的,\(s'=0\) 时意味着 \(d=1\)。
因此 \(\sum_{d \mid n}\mu(d)=\sum_{s'=0}^{s}C_{s}^{s'}(-1)^{s'}\)
\(=\sum_{s'=0}^{s}C_{s}^{s'}(-1)^{s'}1^{s-s'}\)
\(=((-1)+1)^s=0^s\)。
上面两步运用的是二项式定理。
二项式定理:\((a+b)^n=\sum_{i=0}^{n}C_n^ia^ib^{n-i}\)
因此,要证明的就是 \([n=1]=0^s\),而 \(n \ne 1\),即证 \(0^s=0\),又因为 \(n>1 \Rightarrow s \ge 1 \Rightarrow 0^s=0\),因此原式得证,\(n \ge 2\) 部分证毕。
综上,所求证明式 \([n=1]=\sum_{d \mid n}\mu(d)\) 成立。
得到这个之后,我们考虑将 \(n\) 替换成 \(\gcd(i,j)\),原式同样成立,得到:
法二:直接根据 \(I*\mu=\epsilon\),展开即可。
这个式子就是莫反的一个重要结论,注意一下这不是正经的莫反,只是个结论。
这个式子的好处在于碰到一些跟 \(\gcd\) 有关的式子时,如果使用正经的莫反需要另设两个函数,但是直接使用这个式子可以将 \(\gcd\) 转化成对 \(\mu(d)\) 的一种特殊求和,然后采用枚举 \(d\) 的方式提出求和符号,从而解决问题。
本结论对应可以解决例题 1。
接下来推正经莫反的式子,不会狄利克雷卷积的自行出门学习。
我们设 \(g=f*I\),因为 \(f=f*\epsilon,\epsilon=I*\mu\),所以 \(f=f*I*\mu=g*\mu\)。
将狄利克雷卷积拆掉,就得到了莫反的第一个式子:
另外还有一个比较常用的式子:
新定义一种卷积 \(f\oplus g\)(此处的 \(\oplus\) 是一种符号,不是异或),\(t=f\oplus g \Rightarrow t(d)=\sum_{d \mid n}f(n)g(\dfrac{n}{d})\)。
模仿狄利克雷卷积,我们令 \(g=f\oplus I\),易证 \(f=f\oplus \epsilon,\epsilon=I \oplus \mu\) 依然成立,所以 \(f=f\oplus\epsilon=f\oplus I\oplus\mu=g \oplus \mu\)。
注意上述过程中需要证明结合律也是成立的。
然后拆掉式子,就得到了莫反的第二个式子:
这两个式子可以对应解决例题 2。
4. 例题
因为是新学的,所以推式子会推的尽量详细,每一步都会推到位。
例题 1:给出 \(k \leq n \leq m \leq 10^5\),求下列式子的值:\(\sum_{i=1}^{n}\sum_{j=1}^{m}[\gcd(i,j)=k]\),多组数据,数据组数 \(T \leq 10^5\)。
套路式的把 \(k\) 从 \(\gcd\) 中丢掉,变成 \(\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{k}\rfloor}[\gcd(i,j)=1]\)。
然后套上我们推出来的式子:\([\gcd(i,j)=1]=\sum_{d \mid \gcd(i,j)}\mu(d)\)
原式变成 \(\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{k}\rfloor}\sum_{d \mid \gcd(i,j)}\mu(d)\)。
考虑提前枚举 \(d\),变成 \(\sum_{d=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{k}\rfloor}\mu(d) \times [d \mid \gcd(i,j)]\)。
然后将 \(\mu(d)\) 提前,变成 \(\sum_{d=1}^{\lfloor\frac{n}{k}\rfloor}\mu(d)\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}\sum_{j=1}^{\lfloor\frac{m}{k}\rfloor}[d \mid \gcd(i,j)]\)。
再转换,变成 \(\sum_{d=1}^{\lfloor\frac{n}{k}\rfloor}\mu(d)\sum_{i=1}^{\lfloor\frac{n}{k}\rfloor}[d \mid i]\sum_{j=1}^{\lfloor\frac{m}{k}\rfloor}[d \mid j]\)。
若 \(d \mid \gcd(i,j)\),则 \([d \mid \gcd(i,j)]=[d \mid i] \times [d \mid j]\)。
于是式子变成 \(\sum_{d=1}^{\lfloor\frac{n}{k}\rfloor}\mu(d) \times \lfloor\dfrac{n}{kd}\rfloor\times\lfloor\dfrac{m}{kd}\rfloor\)。
此处运用的式子:\(\sum_{i=1}^{n}[d \mid i]=\lfloor\dfrac{n}{d}\rfloor\)。
然后利用整除分块在 \(O(\sqrt{\dfrac{n}{k}})\) 时间内解决单组数据,总复杂度 \(O(n+t\sqrt{\dfrac{n}{k}})\)。
得到这个之后,套上一个差分便可以解决这道题:P2522 [HAOI2011]Problem b。
例题 2:给定 \(n\le m \le 10^6\) 和数列 \(\{f_i\}\),求下列式子的值,多组数据,数据组数 \(t \le 10^4\):
首先有一个式子:\(g(\gcd(a,b))=\sum_{d \mid \gcd(a,b)}f(d)=\sum_{d \mid a,d \mid b}f(d)\)。
也就是 \(g=I*f\) 的时候有上述式子。
考虑我们已经知道了一个 \(g=I*f\),那么原式等于 \(\sum_{i=1}^{n}\sum_{j=1}^{m}\sum_{d\mid a,d\mid b}g(d)\)
\(=\sum_{d=1}^{n}g(d)\sum_{i=1}^{n}\sum_{j=1}^m[d \mid i][d \mid j]\)(注意 \(n \le m\))
\(=\sum_{d=1}^ng(d)\times\lfloor\dfrac{n}{d}\rfloor\times\lfloor\dfrac{m}{d}\rfloor\)。
然后整除分块即可。
至于 \(g\),直接根据 \(f=I*g\Rightarrow g=f*\mu\) 求解即可。
5. 总结
莫比乌斯函数定义:\(I*\mu=\epsilon\)。
计算方式:
- 定义 \(\mu(1)=1\)。
- 对于 \(n \ge 2\),如果 \(n\) 能表示成 \(\prod_{i=1}^k p_i\) 的形式,其中所有 \(p_i\) 都是质数,即分解质因数后指数均为 1,那么 \(\mu(n)=(-1)^k\),否则 \(\mu(n)=0\)。
三个重要式子:
后面我会专门写一篇博文,简单写下莫比乌斯函数与欧拉函数在狄利克雷卷积之下有什么好用的性质。