Number Theory(3)

7 数论函数基础

数论函数是数论中相当重要的一环,我们先来将一些基本的函数。

7.1 相关定义

  • 数论函数:定义域为正整数的函数称为 数论函数。因其在所有正整数处均有定义,故可视作数列。OI 中常见的数论函数的陪域(即可能的取值范围)为整数。

  • 加性函数:若对于任意 \(a,b \in \mathbb N_+\)\(a \bot b\) 均有 \(f(ab) = f(a) + f(b)\),则称 \(f\)加性函数。注意区分代数中的加性函数。

  • 积性函数:若对于任意 \(a,b \in \mathbb N_+\)\(a \bot b\) 均有 \(f(ab) = f(a)f(b)\),则称 \(f\)积性函数。容易发现 \(f(1)=1\) 是必要条件。

  • 完全积性函数:若对于任意 \(a,b \in \mathbb N_+\) 均有 \(f(ab)=f(a)f(b)\),则称 \(f\)完全积性函数。完全积性函数一定是积性函数。

  • 数论函数的 加法:对于数论函数 \(f,g\)\(f+g\) 表示 \(f\)\(g\) 对应位置相加,即 \((f+g)(x) = f(x) + g(x)\)

  • 数论函数的 数乘:对于数 \(c\) 和数论函数 \(f\)\(c \cdot f\) 表示 \(f\) 的各个位置乘 \(c\),即 \((c \cdot f)(x) = c \cdot f(x)\)。一般简记作 \(cf\)

  • 数论函数的 点乘:对于数论函数 \(f,g\)\(f \cdot g\) 表示 \(f\)\(g\) 对应位置相乘,即 \((f \cdot g) (x) = f(x)g(x)\)。为与狄利克雷卷积符号 \(*\) 作区分,点乘符号通常不省略。


7.2 常见函数

\(n\) 的唯一分解为 \(\prod_{i=1}^m {p_i}^{c_i}\),以下是一些常见的数论函数:

  • 单位函数:\(\epsilon (n) = [n=1]\)完全积性函数

  • 常数函数:\(1(n) = 1\)完全积性函数

  • 恒等函数:\(\text{id}_k(n) = n^k\)\(\text{id}_1(n)\) 记作 \(\text{id}(n)\)完全积性函数

  • 除数函数:\(\sigma_k(n)= \sum_{d \mid n} d^k\)\(\sigma_0(n)\) 表示 \(n\) 的约数个数,记作 \(\tau (n)\)\(d(n)\)\(\sigma_1(n)\) 表示 \(n\) 的约约数和,记作 \(\sigma (n)\)\(\sigma_k(n)\) 有计算式

\[\begin{cases} \prod_{i=1}^m (c_i+1) & k=0 \\ \prod_{i=1}^m \frac {{p_i}^{(c_i+1)k}-1} {p_i -1} & k \gt 0 \end{cases} \]

根据乘法分配律,\(n\) 的所有约数的 \(k\) 次方之和可以写成

\[\prod _{i=1}^m \sum_{j=0}^{c_i} {p_i}^{jk} \]

等比数列求和后即可。

  • 欧拉函数:\(\varphi(n) = \sum_{i=1}^n [i \bot n]\),表示 \(n\) 以内与 \(n\) 互质的数的个数。后面我们会有所介绍。

  • 本质不同质因子个数函数:\(\omega (n) = \sum_{p \in \mathbb P} [p \mid n]\),表示 \(n\) 的本质不同质因子个数。

  • 莫比乌斯函数:

\[\mu(n) = \begin{cases} 1 & n=1 \\ 0 & \exists d \gt 1 ,d^2 \mid n \\ (-1)^{w(n)} & \text{otherwise} \end{cases} \]

以上所有函数除 \(\omega\) 是加性函数外,其余都是积性函数。根据计算式及积性函数的定义易证。


7.3 线性筛积性函数

在前面的素数部分,我们分析了线性筛素数,它提供了在线性时间内筛出具有特殊性质的积性函数在 \(1 \sim n\) 处所有取值的基本框架。

只要积性函数 \(f\) 可在 \(\mathcal O(1)\) 时间内计算任意指数幂处的取值 \(f(p^k)\),就适用线性筛。(这只是 \(f\) 可线性筛的 充分但不必要 条件。存在更弱的条件使得 \(f\) 可线性筛但并不常见,如 \(\mathcal O(k)\) 计算 \(f(p^k)\),这会在下一章介绍)。

根据积性函数的性质,只要预先求出 \(low_i\) 表示 \(i\) 的最小质因子 \(p\) 的最高次幂 \(p^{v_p(i)}\),对于 \(i \neq p^k\),即可使用 \(f(low_i)f(\frac {i} {low_i})\) 计算 \(f(i)\)。其中 \(v_p(i)\) 表示质因数次数符号。


下面放一个框架,from Alex_Wei:

for(int i = 2; i < N; i++) {
  if(!vis[i]) pr[++pcnt] = i, f[i] = ..., low[i] = i; // 单独算 f(p)
  for(int j = 1; j <= pcnt && i * pr[j] < N; j++) {
    vis[i * pr[j]] = 1;
    if(i % pr[j] == 0) { // i 与 p 不互质
      low[i * pr[j]] = low[i] * pr[j];
      if(i == low[i]) f[i * pr[j]] = ...; // i = p ^ k,单独算 f(p ^ {k + 1})
      else f[i * pr[j]] = f[i / low[i]] * f[low[i * pr[j]]];
      break;
    }
   	low[i * pr[j]] = pr[j];
    f[i * pr[j]] = f[i] * f[pr[j]]; // i 与 p 互质,f(ip) = f(i)f(p) 
  }
}

8 狄利克雷卷积

钢筋混凝土。


8.1 定义与性质

两个数论函数 \(f,g\) 的狄利克雷卷积为一个新的数论函数,记作 \(f * g\)。定义

\[h(n) = \sum_{x \times y = n} f(x)g(y) = \sum_{d \mid n} f(d) g( \frac nd) \]

上面简记成 \(h = f *g\)。按照定义是计算狄利克雷卷积,复杂度为 \(\mathcal O(n \ln n)\)


狄利克雷卷积还有一些有趣的性质。

交换律,分配律,结合律

\[\begin{aligned} f * g & = g*f & 交换律 \\ (f+g)*h & = f*h + g*h & 分配律 \\ (f*g)*h & = f * (g*h) & 结合律 \end{aligned} \]

这三个东西都可以用定义式稍微推一下就证明出来了。


单位元: \(\epsilon * f = f\)


逆元:若函数 \(f,g\) 满足 \(f * g =\epsilon\),则称 \(f,g\) 互为逆元。

积性函数总是有且仅有一个逆元。


\(f\) 可逆当且仅当 \(f(1) \neq 0\)

下面写出证明和逆元的计算式:

\(g= f^{-1}\)。当 \(f(1)=0\) 时,\(f(1)g(1) = 1\)\(f(1)g(1) = \epsilon (1) = 1\) 矛盾。当 \(f(1) \neq 0\) 时,\(g(1) = \frac 1 {f(1)}\),对于 \(n \gt 1\)\(g(n)\),我们可以用已知的 \(g(1) \sim g(n-1)\) 推出

\[\begin{aligned} (f*g)(n) & = \epsilon (n) \\ \sum_{d \mid n} f(d) g(\frac n d) & =0 \\ g(n)f(1) + \sum_{d \mid n,d \neq 1} f(d) g(\frac n d) & =0 \\ g(n) & = - \frac {\sum_{d \mid n,d \neq 1} f(d) g(\frac n d)}{f(1)} \end{aligned} \]

这同时也说明了逆元的 唯一性


\(f= g\) 的充要条件是 \(f*h = g*h\),其中 \(h(1) \neq 0\)

直接乘上 \(h\) 的逆元即可。


积性函数的狄利克雷卷积也是积性函数

设有两个积性函数 \(f,g\),令 \(h =f * g\),设 \(a,b\) 满足 \(a \bot b\)

\[\begin{aligned} h(ab) & = \sum_{d \mid ab} f(d) g(\frac {ab} d) \\ & = \sum_{T \mid ab,d \mid a,t \mid b,dt = T} f(dt) g(\frac {ab}{dt}) \\ & = \sum_{d \mid a} \sum_{t \mid b} f(d) f(t) g(\frac a d) g(\frac b t) \\ & = \left(\sum_{d \mid a} f(d) g(\frac a d) \right) \left( \sum_{t \mid b} f(t) g(\frac b t) \right) \\ & = h(a) h(b) \end{aligned} \]

第二行中,由于 \(a \bot b\),所以满足 \(d \mid a,t \mid b,dt = T\)\(d,t\) 只有一对,可以从 \(w\) 中分别提取属于 \(a,b\) 的质因子得到。


积性函数的逆元也是积性函数

设有积性函数 \(f\),它的逆是 \(g\)。设 \(a,b\) 满足 \(a \bot b\),证 \(g(ab) = g(a)g(b)\)

使用归纳法。当 \(a\)\(b\)\(1\) 时,根据计算式显然成立。假设我们对 \(a' \lt a,b' \lt b\)\((a',b')\) 都已经完成了证明,根据求你计算式可得

\[\begin{aligned} g(ab) & = - \sum_{d \mid ab ,d \neq 1} f(d) g( \frac {ab} d) \\ & = - \sum_{i \mid a,j \mid b,ij \neq 1} f(i)f(j)g(\frac a i) g(\frac b j) \\ & = f(1)f(1)g(a)g(b) - \sum_{i \mid a} f(i) g(\frac a i)\sum_{j \mid b} f(j) g(\frac b j) \\ & = f(1)f(1)g(a)g(b) - \epsilon (a) \epsilon (b) \\ & = g(a)g(b) \\ \end{aligned} \]

综合后面的两个性质,两个积性函数的积与商都是积性函数,但和与差不是。


8.2 线性筛狄利克雷卷积

给出 \(f,g\) 如何快速计算 \(h = f*g\) 呢?


我们直接用定义式计算,把枚举因数变成枚举倍数,根据调和级数,时间复杂度为 \(O(n \ln n)\)


如果 \(f,g\) 是积性函数,我们可以尝试以下的优化,写出 \(h\) 的表达式,有

\[h(n) = \begin{cases} 1 & n=1 \\ \sum_{c=0}^k f(p^c)g(p^{k-c}) & n=p^k \\ h(p^k) h(m) & n = p^k m(m \gt 1,p \nmid m) \end{cases} \]

对于第一项和第三项,我们都可以在线性筛中总代价 \(\mathcal O(n)\) 求出,而现在问题就来到了第二项。

如果 \(f,g\) 在质数幂处的取值已经求出,则需要 \(\mathcal O(k)\) 的时间计算,我们尝试估算它的复杂度。考虑所有 \(\le \sqrt[k] n\) 的质数对复杂度产生 \(O(k)\) 的贡献,因此

\[T(n) = \sum_{x=1}^{\log_2 n} x \pi(\sqrt[x] n) = \sum_{x=1}^{\log_2 n} \frac {x \sqrt[x] n}{\ln \sqrt[x] n} = \frac 1 {\ln n} \sum_{x=1}^{\log_2 n} x^2 \sqrt[x] n \]

\(x^2 \sqrt[x] n\) 随着 \(n\) 增大,而 \(x^2\) 的增大速度,远小于 \(\sqrt[x] n\) 的减小速度,于是从这一点入手,我们考虑证明 \(x^2 \sqrt [x] n \le O(n)\)

\(x=1\) 是显然成立,于是考虑 \(x \in [2,\log_2 n]\)\(x^2\) 的最大值 \(\log_2^2 n\)\(\sqrt [x] n\) 的最大值 \(\sqrt n\) 之积,因为当 \(x \to + \infty\)\(\log_2 x\)\(\sqrt x\) 的高阶无穷小,所以 \(\mathcal O(\sqrt n \log^2 n) \le \mathcal O(n)\)

因此,

\[T(n) \le \frac 1 {\ln n} \sum_{i=1}^{\log_2 n} \mathcal O(n) = \mathcal O(n) \]

综上,使用线性筛求出两个在质数幂处取值已知的积性函数的狄利克雷卷积在 \(1 \sim n\) 处的取值的时间复杂度是 \(\mathcal O(n)\)

这样我们就得到了积性函数线性筛更弱的条件:可以 \(\mathcal O(k)\) 时间计算质数幂处的取值。


P6222 「P6156 简单题」加强版

给出 \(k\),多次给出 \(n\),求

\[\sum_{i=1}^n \sum_{j=1}^n (i+j)^K \mu^2(\gcd(i,j)) \gcd(i,j) \]

\(1 \le n \le 10^7,K \le 2^{31},T \le 10^4\)

会用到稍后要讲的莫比乌斯反演。


枚举 gcd,再进行莫比乌斯反演

\[\newcommand {\lf} {\left \lfloor} \newcommand {\rf} {\right \rfloor} \begin{aligned} & \sum_{i=1}^n \sum_{j=1}^n (i+j)^K \mu^2(\gcd(i,j)) \gcd(i,j) \\ = & \sum_{d=1}^n \mu^2(d) d \sum_{i=1}^n \sum_{j=1}^n [\gcd(i,j) = d] (i+j)^k \\ = & \sum_{d=1}^n \mu^2(d) d \sum_{i=1}^{\lf \frac n d \rf} \sum_{j=1}^{\lf \frac n d \rf} [\gcd(i,j) = 1] d^k (i+j)^k \\ = & \sum_{d=1}^n \mu^2(d) d \sum_{i=1}^{\lf \frac n d \rf} \sum_{j=1}^{\lf \frac n d \rf} d^k (i+j)^k \sum_{t \mid i,t\mid j} \mu(t) \\ = & \sum_{T=1}^n \left( \sum_{d \mid T} \mu^2(d) d \mu\left(\frac T d \right) \right) T^k \sum_{i=1}^{\lf \frac n T \rf} \sum_{j=1}^{\lf \frac n T \rf} (i+j)^k \end{aligned} \]

我们需要线性筛预处理出 \(f=(d \times \mu^2) * \mu\),并对 \(T^k\) 做前缀和,整除分块求解,时间复杂度 \(\mathcal O(n \frac {\log k} {\log n})\)

这就需要用到我们上面讨论的线性筛狄利克雷卷积。代码


简单版本:P6156 简单题


8.3 狄利克雷前缀和

对于任意数论函数 \(f\) 卷常数函数 \(1\) 等价于对 \(f\)狄利克雷前缀和:令 \(g = f * 1\),则 \(g(n) = \sum_{d \mid n} f(d)\)

对每个 \(n\) 计算给定数论函数在其所有因数处的取值之和有很好的实际含义,因此狄利克雷前缀和是相当重要的。


首先容易想到一种暴力做法,直接枚举每一个数的倍数,这样就可以做到 \(\mathcal O(n \ln n)\)

但是并不是最优的,于是我们有了下面的算法。


将每个数 \(n\) 写成一个无穷的序列 \(a_n = \{ c_1,c_2,\cdots \}\),表示 \(n = \prod p_i^{c_i}\),其中 \(p_i\) 表示第 \(i\) 个质数。因为 \(x \mid y\) 的充要条件是 \(a_x (c_i) \le a_y(c_i)\),所以 \(f * 1\) 可以看成对下标做关于其无穷序列的高维前缀和,即

\[g(n) = \sum_{\forall i ,a_d(c_i) \le a_n(c_i)} f(d) \]

根据高位前缀和的求法,枚举每一维并将所有下标关于该维做前缀和,可以得到狄利克雷前缀和的实现方法:

初始令 \(x_i = f(i)\),从小到大枚举每一个质数 \(p_i\),枚举 \(k\),将 \(x_{p_ik}\) 加上 \(x_k\),相当于 \(k\) 的贡献给到 \(a_k(i)\) 加上 \(1\) 之后的下标。

最终得到的 \(x\) 即为 \(g\)。根据小于 \(n\) 的素数倒数之和是 \(\ln \ln n\) 这一结论(埃氏筛法),狄利克雷卷积的时间复杂度是 \(\mathcal O(n \ln \ln n)\)

于是你就可以通过 P5495 【模板】Dirichlet 前缀和 了。代码

#include <bits/stdc++.h>
using namespace std;
#define uint unsigned int

const int N=2e7+5;
uint seed,ans,a[N];
int n,p[N>>3],cnt=0;
bool vis[N];

uint rd(){seed^=seed<<13,seed^=seed>>17,seed^=seed<<5;return seed;}

void init(){
  for(int i=2;i<N;i++){
    if(!vis[i]) p[++cnt]=i;
    for(int j=1;j<=cnt&&i*p[j]<N;j++){
      vis[i*p[j]]=true;
      if(i%p[j]==0) break;
    }
  }
}

int main(){
  cin>>n>>seed;init();
  for(int i=1;i<=n;i++) a[i]=rd();
  for(int i=1;i<=cnt;i++) for(int j=1;p[i]*j<=n;j++) a[p[i]*j]+=a[j];
  for(int i=1;i<=n;i++) ans^=a[i];
  cout<<ans;return 0;
}

9 整除分块

整除分块又称为数论分块,因其解决的问题与整除密切相关而得名。数论分块是用于求解形如

\[\sum_{i=1}^n f(i) g\left( \left \lfloor \frac n i \right \rfloor \right) \]

的合适,前提为 \(f\) 的前缀和可以快速计算。


9.1 介绍

如果 \(\left \lfloor \frac n i \right \rfloor\) 的数量不多,那么我们可以考虑转化成贡献形式,把原式写成若干个 \(g\left( \left \lfloor \frac n i \right \rfloor \right)\) 乘上一段 \(f\) 的和。那么不同的 \(\left \lfloor \frac n i \right \rfloor\) 到底又多少个呢?


\(\forall i \in [1,n],n \in \mathbb N_+\),不同的 \(\left \lfloor \frac n i \right \rfloor\) 至多只有 \(2 \sqrt n\) 个。

证明是简单的:

  • \(i \le \sqrt n\) 时,\(\left \lfloor \frac n i \right \rfloor\) 只有 \(\sqrt n\) 个。

  • \(i \gt \sqrt n\) 时,\(\left \lfloor \frac n i \right \rfloor \le \sqrt n\),也只有 \(\sqrt n\) 个。


根据这条结论,我们枚举 \(\mathcal O(\sqrt n)\) 种整除值 \(d\),求出最小和最大的 \(i\) 使得 \(\left \lfloor \frac n i \right \rfloor = d\),分别记作 \(l,r\),那么原式可以写成

\[\sum_d g(d) \sum_{i=l}^r f(i) \]

只要我们能对 \(f\) 进行快速的前缀和预处理,在 \(g\) 处能快速得到值,那么整个和式就可以在 \(\mathcal O(\sqrt n)\) 的时间复杂度内求得。


那么问题就转化成求使得 \(\left \lfloor \frac n i \right \rfloor = d\) 的最大和最小的 \(i\)


转化一下,发现 \(\left \lfloor \frac n i \right \rfloor = d\)\(i\) 有两条限制:

\[i(d+1) \gt n \]

\[id \le n \]

两边把 \(d\) 除过去就可以得到

\[\left \lfloor \frac n {d+1} \right \rfloor \lt i \le \left \lfloor \frac n d \right \rfloor \]

那么我们不重不漏地枚举所有整除值时,可以对于每一个 \(i\) 计算 \(\left \lfloor \frac n i \right \rfloor\)\(l\)\(r\),借助上面的式子跳过这个极长的连续段。

具体地,我们令当前枚举到的 \(i\)\(l\),此时整除值为 \(d = \left \lfloor \frac n i \right \rfloor\)。因为使得 \(\left \lfloor \frac n i \right \rfloor =d\) 的最大的 \(i\) 等于 \(\left \lfloor \frac n d \right \rfloor\),所以

\[r=\left \lfloor \frac n {\left \lfloor \frac n l \right \rfloor} \right \rfloor \]

\(g(d)(s(r)-s(l-1))\) 算入答案,下一次 \(l=r+1\) 表示跳过了 \(l \sim r\) 这一段,如果 \(l \gt n\) 就退出即可。(\(s\) 是前缀和)


这样每一次的整除值都可以被算一次,时间复杂度 \(\mathcal O(\sqrt n)\)

  • \(i\) 的上界不为 \(n\) 时,要特殊处理:若 \(m \le n\),每次要把 \(r\)\(m\) 取最小值;反之要特殊处理 \(\left \lfloor \frac n i \right \rfloor =0\) 的情况。

  • 写的时候不要写成了 \(r \le n\) 了!(有些人因为这个常常调很久)


9.2 拓展

拓展也是较为简单的。


我们尝试将 向下取整 转换成 向上取值

对于左边界 \(l\),求出使得 \(\left \lceil \frac n l \right \rceil = \left \lceil \frac n r \right \rceil\) 的最大的 \(r\)

\(k=\left \lceil \frac n l \right \rceil\),那么

\[\begin{aligned} \frac n r & \gt k-1 \\ \therefore r(k-1) & \lt n \\ \therefore r & \lt \frac n {k-1} \\ \therefore r & \le \frac {n-1} {k-1} \end{aligned} \]

最后一步是因为 \(n,k\) 都是正整数,于是我们每次有

\[r= \left \lfloor \frac {n-1} {\left \lceil \frac n l \right \rceil -1} \right \rfloor \]

注意到 \(\left \lceil \frac n l \right \rceil = 1\) 时上界为 \(+ \infty\),所以要去实际上界。


另外一个拓展就是我们尝试进行 高维数论分块

当和式中出现若干个下取整,形如

\[\sum_{i=1}^n f(i) \sum_{j=1}^m g\left(\right) \]

时,我们只需要每次令

\[r = \min_{j=1}^c \left( \left \lfloor \frac {n_j} {\left \lfloor \frac {n_j} l \right \rfloor} \right \rfloor \right) \]

即可。最后要对 \(n\)\(\min\)

时间复杂度 \(\sum \sqrt {n_j}\)

因为我们把存在 \(n_j\) 满足 \(\left \lfloor \frac {n_j} i \right \rfloor \neq \left \lfloor \frac {n_j} {i+1} \right \rfloor\) 的位置 \(i\) 视作断点,总断点数量为每个下取整式的断点数量相加,于是就有该时间复杂度。


9.3 例题

几道简单题。


CF1603C Extreme Extension

对于一个数列,定义一次操作为选择数列中任何一个元素 \(a_i\) ,将这个位置替换成两个正整数 \(x,y\) 满足 \(x+y=a_i\)

定义一个数列的极端值为将这个数列变成 不降 数列的最小操作次数

给定一个长度为 \(n\) 的数列 \(a\)\(1\leq a_i\leq 10^5\) ),让你求它的所有非空子段的极端值之和,对 \(\text{998244353}\) 取模

一个测试点中有多组数据,保证所有数据 \(n\) 的规模总和不超过 \(10^5\)


P2260 [清华集训2012] 模积和

\[\sum_{i=1}^{n} \sum_{j=1}^{m} (n \bmod i) \times (m \bmod j), i \neq j \]

mod 19940417 的值

\(1 \le n,m \le 10^9\)


P3579 [POI2014] PAN-Solar Panels

对于 \(n\) 组询问,每组询问给定四个整数 \(a,b,c,d\),从区间 \([a,b]\)\([c,d]\) 中任意选取两个整数 \(x\)\(y\),求 \(\gcd(x,y)\) 的最大值是多少。

\(1 \le n \le 1000\)\(1 \le a \le b \le 10^9\)\(1 \le c\le d \le 10^9\)


10 欧拉函数

欧拉函数是一类非常重要的数论函数。


10.1 定义与性质

欧拉函数的定义为在 \([1,n]\) 中与 \(n\) 互质的整数的个数,记作 \(\varphi(n)\)

显然,当 \(n\) 是质数时,有 \(\varphi(n) = n-1\)


\(p\) 为质数,则 \(\varphi(p^k) = (p-1)\times p^{k-1}\)

\([1,p^k]\) 中不是 \(p\) 的倍数的数都和 \(p^k\) 互质。因此 \(\varphi(p^k) = p^k - p^{k-1} = (p-1)p^{k-1}\)


\(\varphi\)积性函数。即若 \(\varphi(ab) = \varphi(a) \times \varphi(b)\)

设与 \(a\) 互质的数为 \(\{ a_1,a_2,\cdots,a_{\varphi(a)} \}\),那么在 \([1,ab]\) 内与 \(a\) 互质的整数可以表示为 \(i \times a + a_j(0 \le i \lt b,1 \le j \le \varphi(a))\)

因为 \(a \bot b\),所以 \(ia (0 \le i \lt b)\) 在模 \(b\) 意义下互不相同,即对于每一个 \(a_j\)\(\{ i \times a + a_j \}(0 \le i \lt b)\) 均构成 \(b\) 的完全剩余系 \(\{ 0,1,\cdots,b-1 \}\),即随着 \(i\)\(0\) 变到 \(b-1\)\(i \times a + a_j\)\(b\) 的余数取遍 \(0 \sim b-1\)

因此,对于每一个 \(a_j\),满足 \(b \bot i \times a + a_j\)\(i\) 的个数为 \(\varphi(b)\),所以与 \(ab\) 互质的数的个数为 \(\varphi(ab) = \varphi(a) + \varphi(b)\)。得证。


根据算术基本定理,设 \(n\) 被唯一分解为 \(\prod_{i=1}^m {p_i}^{c_i}\),则 \(\varphi(n) = n \times \prod_{i=1}^m \frac {p_i-1} {p_i}\)

根据前面两个性质

\[\varphi(n) = \prod_{p} \varphi(p^k) = \prod_{p} p^k \times \frac {p-1} p = n \times \prod_{i=1}^m \frac {p_i-1} {p_i}; \]

得证。

当然,我们还可以用 容斥原理 来证明。

考虑去掉所有被至少一个 \(n\) 的质因子整除的数,再加上被至少两个 \(n\) 的质因子整除的数,以此类推,我们可以得到

\[\varphi(n) = n \times \sum_{S} \frac {(-1)^{|S|}} {\prod_{p \in S} p} \]

其中 \(S\)\(n\) 的质因子集合的子集。容易发现,这个式子就是

\[n \times \prod_{p_i} \left( 1 - \frac 1 {p_i} \right) \]

这样我们也可以反推到积性函数上面。设 \(a = \prod_{i=1}^{m_1} {p_i}^{c_i},b= \prod_{i=1}^{m_2} {q_i}^{d_i}\)。由于 \(a \bot b\),所以 \(p_i,q_i\) 互不相同。因此

\[ab = \prod_{i=1}^{m_1} {p_i}^{c_i} \times \prod_{i=1}^{m_2} {q_i}^{d_i} \]

于是有

\[\varphi(ab)= ab \times \prod_{i=1}^{m_1} \frac {p_i-1} {p_i} \times \prod_{i=1}^{m_2} \frac {q_i -1} {q_i} = \varphi(a) \times \varphi(b) \]


\(a \mid b\),则 \(\varphi(ab) = a \times \varphi(b)\)

根据前面 \(\varphi\) 的计算式,容易发现这时比较显然的。

于是我们也容易得到这样的结论:

\(a \mid b\),则 \(\varphi(a) \mid \varphi(b)\)


欧拉反演:

\[\sum_{d \mid n} \varphi(d) = n \]

考虑 \(\varphi(n)\) 的定义是与 \(n\) 互质的数的个数,那么容易发现 \(\varphi(n)\) 就是分母为 \(n\) 的最简基本分数的个数,而法里级数 \(\mathscr F_n\) 既包含分母不超过 \(n\)\([0,1]\) 范围内的所有最简分数,我们尝试从这一点来论证欧拉反演。

我们把法里级数中非零的部分提出来,例如当 \(n=12\) 时,在约分成最简基本分数前,分母为 \(12\) 的所有基本分数集合是

\[\frac 1 {12},\frac 2 {12},\frac 3{12},\frac 4 {12},\frac 5 {12},\frac 6 {12},\frac 7 {12},\frac 8 {12},\frac 9 {12},\frac {10}{12},\frac {11}{12},\frac {12} {12} \]

约分得到

\[\frac 1 {12},\frac 1 6,\frac 1 4,\frac 1 3,\frac {5} {12},\frac 1 2,\frac 7 {12},\frac 2 3,\frac 3 4,\frac 5 6,\frac {11}{12},\frac {1} {1} \]

我们可以根据它们的分母将这些分数分组,就可以得到

\[\frac 1 1;\frac 1 2 ;\frac 1 3,\frac 2 3;\frac 1 4,\frac 3 4;\frac 1 6,\frac 5 6;\frac 1 {12},\frac 5 {12},\frac 7 {12},\frac {11} {12} \]

对此,我们如何就是呢?

发现 \(12\) 的每一个因子都出现在分母上,与其一起出现的还有 \(\varphi(d)\) 个分子,从而

\[\varphi(1) + \varphi(2) + \varphi(3) + \varphi(4) + \varphi(6) + \varphi(12) = 12 \]

也就是

\[\sum_{d \mid n} \varphi(d) = n \]

这就是 欧拉反演


同时它可以被表示成狄利克雷卷积的形式,也就是 \(\varphi * 1 =\text{id}\),这在杜教筛中颇有应用。


\(2 \mid \varphi(n) (n \gt 2)\)

假设 \(x \bot n\),那么一定有 \((n-x) \bot n\)。于是与 \(n\) 互质的数是两两配对的,唯一的特殊情况就是 \(x = n-x\) 的时候。

容易发现这种情况显然是满足条件的,即 \(x=\frac n 2\),那么 \(\gcd(n,x) = x \neq 1\)。得证。这个性质在莫反的某道题中有所应用。


使得 \(\gcd(n,x) = d\)\(1 \le x \le n\)\(x\) 的个数为 \(\varphi \left( \frac nd \right)\)

使得这个条件成立的条件可以被表示成 \(\frac n d \bot \frac x d\),同时 \(1 \le \frac x d \le \frac n d\),从而答案就是 \(\varphi \left( \frac n d \right)\)。得证

如果我们把条件转移到 \(0 \le x \lt n\),也是成立的,因为我们之前定义了 \(\gcd(0,n) = \gcd(n,n) = n\)


10.2 线性筛欧拉函数

根据上面欧拉函数的计算式,我们可以得到它的线性筛法,若 \(p \mid n\),则

\[\varphi(n) = \begin{cases} p \times \varphi \left( \frac n p \right) & p^2 \mid n \\ (p-1) \times \varphi \left(\frac n p \right) & p^2 \nmid n \end{cases} \]

于是代码就是简单的

  phi[1]=1;
  for(int i=2;i<N;i++){
  	if(!vis[i]) p[++cnt]=i,phi[i]=i-1;
  	for(int j=1;j<=cnt&&i*p[j]<N;j++){
  	  vis[i*p[j]]=true;
	  if(i%p[j]==0){
	  	phi[i*p[j]]=phi[i]*p[j];
	  	break;
	  }	
	  else phi[i*p[j]]=phi[i]*(p[j]-1);
	}
  }

10.3 欧拉定理

欧拉发现费马的定理可以用下面的方式推广到非素数的模:

\[n^{\varphi(m)} \equiv 1 \pmod m , 如果 n \bot m \]

这和费马小定理是相当类似的,于是我们可以尝试用类似于费马小定理的方法来证明它。


\(\varphi(m)\) 个数 \(\{ kn \mod m \mid k \bot m 且 0 \le k \lt m \}\) 就是 \(\{ k \mid k \bot m 且 0 \le k \lt m \}\) 按照某种次序排列。

将它们相乘并用 \(\prod_{0 \le k \lt m,k \mid m} k\) 来除即可。


而当 \(m\) 是素数时,带入就可以得到费马小定理。


10.4 扩展欧拉定理

再把欧拉定理进行一个扩展,可以得到

\[a^b = \begin{cases} a^{b \bmod \varphi(m)} & \gcd(a,m) = 1 \\ a^b & \gcd(a,m) \neq 1 ,b \lt \varphi(m) \\ a^{(b \bmod \varphi(m)) + \varphi(m)} & \gcd(a,m) \neq 1,b \ge \varphi(m) \end{cases} \pmod m \]


感性理解:

\(\gcd(a,m) \neq 1\) 时,不断乘 \(a\) 会让 \(a^i\)\(m\)\(\gcd\) 不断变大,这到某个特定的 \(a^r\) 之后 \(\gcd\) 就不再变化,因为此时 \(\gcd(a^r,m)\) 受到 \(m\) 的每个与 \(a\) 相同的质因子的次数限制。

令这个 \(\gcd = d\),考虑 \(a^r \bmod m,a^{r+1} \bmod m,\cdots\),显然它们均是 \(d\) 的倍数,且除以 \(d\) 之后会取遍所有与 \(\frac m d\) 互质的数,这时因为 \(a \bot \frac m d\)

根据欧拉定理,\(a^k \bmod \frac m d\) 有循环节 \(\varphi \left( \frac m d \right)\),因此 \(\left( a^k \bmod {\frac m d} \right) \times d\)\(a^k \bmod m\),也有循环节 \(\varphi \left( \frac m d \right)\),故从 \(a^r\) 开始,\(a^{r+k} \bmod m\) 有循环节 \(\varphi(p)\)

比较抽象,非常感性。


严谨证明 摘自 OI-wiki

  • \(a\) 的从 \(0\) 次,\(1\) 次到 \(b\) 次幂模 \(m\) 构成的序列中,存在 \(r,s\),使得前 \(r\) 个数(即从 \(a^0 \bmod m\)\(a^{r-1} \bmod m\))互不相同,从 \(r\) 开始,每 \(s\) 个数就循环依次。

    在 3.5 中,我们对这个遗留问题进行了讨论。

  • \(a\) 为素数的情况,该是成立。

    证明

    • 若模 \(m\) 不能被 \(a\) 整除,那么有 \(\gcd(a,m) = 1\) 成立,根据欧拉定理容易证明。

    • 若模 \(m\) 能被 \(a\) 整除,那么存在 \(r\)\(m'\) 使得 \(m = a^r m'\),且 \(\gcd(a,m')= 1\) 成立。所以根据欧拉定理有 \(a^{\varphi(m')} \equiv 1 \pmod {m'}\)

    又由于 \(\gcd(a^r,m') = 1\),所以根据欧拉函数的计算式,容易得到 \(\varphi(m) = \varphi(m') \times (a-1)a^{r-1}\),即我们有 \(\varphi(m') \mid \varphi(m)\)

    所以 \(a^{\varphi(m')} \equiv 1 \pmod {m'},\varphi(m') \mid \varphi(m) \Longrightarrow a^{\varphi(m)} \equiv 1 \pmod {m'}\),即 \(a^{\varphi(m)} = km'+1\),两边同时乘 \(a^r\),得 \(a^{r+\varphi(m)} = km+a^r\),因为 \(m = a^r m'\)

    所以 \(m\) 中素因子 \(a\) 的次数 \(r\) 满足:\(a^r \equiv a^{r+\varphi(m)} \pmod {m}\)。我们可以简单变换形式,得到 推论

    \[ b \gt r \Longrightarrow a^b \equiv a^{r+(b-r)\bmod \varphi(m)} \pmod m \]

    又由于 \(m=a^rm'\),所以 \(\varphi(m) = \varphi(a^r) \varphi(m') \ge \varphi(a^r) =a^{r-1} (a-1) \ge r\)

    所以因为 \(\varphi(m) \ge r\),故有:

    \[ a^r \equiv a^{r+\varphi(m)} \equiv a^{r \bmod \varphi(m) + \varphi(m)} \pmod m \]

    所以

    \[ \begin{aligned} a^b & \equiv a^{r+(b-r) \bmod \varphi(m)} \\ & \equiv a^{r \bmod \varphi(m) + \varphi(m) + (b-r) \bmod \varphi(m)} \\ & \equiv a^{\varphi(m) + b \bmod \varphi(m)} \pmod m \end{aligned} \]

    \(a^b \equiv a^{b \bmod \varphi(m) + \varphi(m)}\)

  • \(a\) 为素数幂的情况,该式成立。

    证明

    不妨令 \(a =p^k\),是否依然有 \(\forall r,a^r \equiv a^{r+\varphi(m)} \pmod m\)

    答案是肯定的,由于第一点可知存在 \(s\) 使得 \(a^s \equiv 1 \pmod m\),所以 \(p^{\text{lcm} (s,k)} \equiv 1 \pmod m\),所以令 \(s' = \frac s {\gcd(s,k)}\) 时,我们能有 \(p^{s'k} \equiv 1 \pmod m\)

    此时有关系 \(s' \mid s\)\(s \mid \varphi(m)\),且 \(r' = \left \lfloor \frac r k \right \rfloor \le r \le \varphi(m)\),由 \(r',s'\)\(\varphi(m)\) 的关系,依然可以得到 \(a^b \equiv a^{b \bmod \varphi(m) + \varphi(m)} \pmod m\)

  • \(a\) 为合数的情况,该是成立。

    证明:

    只证 \(a\) 拆成两个素数的幂的情况,大于两个的用数学归纳法可证。

    \(a=a_1a_2\),其中 \(a_i = {p_i}^{k_i}\),而 \(a_i\) 的循环长度为 \(s_i\)

    \(s \mid \text{lcm} (s_1,s_2)\),由于 \(s_1 \mid \varphi(m),s_2 \mid \varphi(m)\),那么 \(\text{lcm}(s_1,s_2) \mid \varphi(m)\),所以 \(s \mid \varphi(m),r=\max \left( \left \lfloor \frac {r_i} {k_i} \right \rfloor \right) \le \max(r_i) \le \varphi(m)\)

    \(r,s\)\(\varphi(m)\) 的关系,依然可以得到 \(a^b \equiv a^{b \bmod \varphi(m) + \varphi(m)} \pmod m\)

证毕。乐。


于是你就可以通过 P5091 【模板】扩展欧拉定理代码


10.5 例题

煎蛋题。


P2158 [SDOI2008] 仪仗队


posted @ 2024-05-21 13:11  H_W_Y  阅读(30)  评论(0编辑  收藏  举报