来自人人上王怡的日志 鄙人稍作修改
2013.8.23 张益唐先生报告之证明概要
23号下午张益唐先生受邀到校做了名为《Bounded gaps between primes and relevant problems》的报告,对他证明“存在无穷多对间隔小于7000万的素数”的思路做了大概讲述。我有幸前去听了这场报告。这篇日志里写的东西,有些我是懂的,有些不明所以,但我都尽量写清楚了,也做了一点补充。
关于张益唐先生及间隔有限的素数对的介绍,请见季理真教授的《素数不再孤单——孪生素数和一个执着的数学家张益唐的传奇》。
关于肖boss的发言以及一些美的体会请见陈张弛gg日志《【整理】素数不孤单——张益唐素数结论之肖杰表述》。
(张益唐先生说,由于在场有不少本科生,还有大一的同学,所以他不能讲得过于专业化。数论很有意思,其中很多问题,就连小学生都知道是什么,但它们的证明非常困难。另外,他建议我们有问题要经常思考,即便有些问题不一定能想出来,但要保持这个状态。)
下面开始。
1.人们(例如Goldstone, Pintz, Yildirim)在研究孪生素数猜想时已用了这样的概念:设一个有限非负整数集
\[\mathcal{H}=\{h_1,h_2,h_3\cdots,h_k\}\]
称$\mathcal{H}$是"可允许的”(admissible),如果对任意素数$p$,存在正整数$n$,使得$p$与$P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)$互素。
(这样的$n+h_1,n+h_2\cdots n+h_k$会有比较好的性质)
例如,$\{2,3\}$不是可允许的,因为对$p=2$不满足;$\{0,2,4\}$不是可允许的,因为对$p=3$不满足;但$\{0,2\},\{0,2,6\}$都是可允许的。
2.1920年左右Hardy和Littlewood提出了这样的猜想:对于一串可允许的$\mathcal{H}$,存在无穷多个n使得$n+h_1,n+h_2\cdots n+h_k$都是素数,而孪生素数猜想正是这个猜想的特殊情况。
3.张益唐证明了如下定理:
设$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允许的,且若其个数$k\ge 3.5\times 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有两个素数。
注:由这个定理就可以推出\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]
也即存在无穷多对素数,其差小于7000万(有限!)。 推导过程我放在后面的“补充”里。
4.怎么切入3中定理呢?
张益唐采用解析数论的办法。解析数论通常会处理有限和,其侧重点是怎么算这个和。有时候会用一些定义在自然数集上的“算术函数”(arithmetic function)。例如设
\[\begin{eqnarray*}
f(n) =
\begin{cases}
1 & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]
对于这样的函数,一种最自然的想法就是求和。例如如上的函数求和就有
\[\pi(x)=\sum_{n\le x}f(n)\]
其中$\pi(x)$是小于等于$x$的素数个数。
5.为什么要研究这样$f(n)$的和呢?因为我们想让一个“可允许”的几何中的素数个数大于1,也就是$\sum_{i=1}^{k} f(n+h_i)>1$对于无穷个$n$成立,这样就能间接地说明$\mathcal{H}$这个集合中有两个素数了,因为$f(n+h_k)$只能为整数。但是这样简洁明了的方法行不通,我们只好退而求其次。引入一个“权”函数$\varphi(x)$。
我们令$$S_1=\sum_{n\le x}\varphi(n),S_2=\sum_{n\le x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$。并来研究 $\frac{S_2}{S_1}$的大小。比如我们就令$\varphi(n)\equiv 1$,那么如果我们证明出来 $S_2>S_1$成立,利用鸽笼原理,立刻就能得到存在一个$n$使得$\left(\sum_{i=1}^k f(n+h_i)\right)>1$,也就是存在一个$n$,让$n+\mathcal{H}$这个集合中有两个素数。
不过直接研究对于$\sum_{n\le x}$似乎不是一个好方法,因为说不定存在的那个$n$一直是个很小的数,所以有时候会利用$\sum_{x\le n\le 2x}\varphi(n)$进行求和。比如我们还是令
$$S_1=\sum_{x\le n\le 2x}\varphi(n),S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$
这时候我们令\[\begin{eqnarray*}
f(n) =
\begin{cases}
\log{n} & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]
那么如果$S_2>\log{(3x)} S_1$,就会有 $S_1=\sum_{i=1}^k f(n+h_i)>\log{3x}$对于某个$n$成立,这样同样可以看出,存在$i,j$使得$f(n+h_i)$与$f(n+h_j)$都是大于0。我们如下的结果都是要证明后面这样一个$S_2>\log{(3x)} S_1$。
但是这些尝试的结果都不尽如人意。有人令$\varphi(n)=n,n^2,n^3$,但是都没有什么出众的结果。这个问题有很长的历史,在其中做出开拓性贡献的是Selberg。
6.既然这样一个$\varphi(n)$的权我们设为正的(如果是负的话,这些不等式估计就毫无意义了),那么我们就可以引入一个函数$\lambda(n)$,使得$\varphi(n)=\lambda(n)^2$,现在问题就转变为寻找一个$\lambda(n)$,让它能导出证明。
而从数论中筛法的角度,Goldston,Pintz,Yildirim三人引入一个这样的$\lambda(n)$,即
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\quad P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)\]
其中$D=x^{\varepsilon},0<\varepsilon<\frac{1}{2}$,而$\mu(n)$为Möbius函数 ,新的常数$\ell$与$k$有关(论文中张选取了$\ell=180$)。
从Hardy、Littlewood到 Goldston、Pintz、Yildirim,80年来才找到这个比较有用的形式。
7.计算两个和,即$$S_1=\sum_{x\le n\le 2x}\lambda(n)^2,S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\lambda(n)^2$$.
大致的计算结果是$S_1\approx T_1 (\log{x})^{k+2\ell},S_2\approx T_2 (\log{x})^{k+2\ell}+O(\mathcal{E})$,其中$O(\mathcal{E})$是误差项。
Goldston等人得出了这样的结果:即在(上述常数$D$中用到的)$\varepsilon<\frac{1}{4}$时,$S_2-(\log{3x})S_1$为负数,显然不能满足要求,但如果$\varepsilon=\frac{1}{4}+\varpi$,虽然$T_2>\log{(3x)} T_1$,但是这两者相减的误差项却很难估计。所以他们三人就止步于此了。
(PS:即使“广义黎曼假设”是对的,在这里也没有帮助)
8.张益唐的想法是对$\lambda(n)$进行一些调整,在式子
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\]
中,有些$d$对$\lambda(n)$的贡献其实很小,所以很小的应该和很大的区分开来。考虑使$\mu(d)!=0$的数$d$,比如如果它有$>x^{1/10}$的因子,那么实际上它对整个序列的和的贡献(即对$\lambda(n)$的贡献)是很小的。我们可以把所有含有因子大于$x$的某个幂次的数“筛”掉,余下来的就是贡献比较大的数了(也许你会问,没筛掉不是会更大吗?实际上,没筛掉的话会对整个和每一项的估计都变少,从而影响整个数列的和)。
张益唐选取的是$\varpi=\frac{1}{1168}$,也就是$D=x^{\frac{1}{4}+\varpi}$,而且拥有大于$x^{\varpi}$的素因子的数将会被“筛”掉。
(张益唐这时提到了杨振宁先生说过的关于治学的话:“宁拙毋巧,宁朴勿华。”开始研究的时候宁愿“笨拙”一点,Goldston等人在计算中采用了比较漂亮的办法,而张益唐用了一些比较原始的办法,算出了同样的结果,同时有了更细致的观察)
所以如上的$\lambda$也就变成了
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|(P(n),\mathcal{P}),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell},\quad \mathcal{P}=\prod_{p<x^{\varpi}}p\]
9.而最关键的东西来了!现在对应的误差项是可以估计出来的!假如$d$满足$x^{\frac{1}{2}-\epsilon}<d<D^2,d|(P(n),\mathcal{P})$(其中$\epsilon$是一个很小的正常数),我们可以看出来它的素因子相当小,但是$d$又很大,所以它素因子个数很多。
我们再给定一个正常数$R<d$,对于$d = p_1\cdots p_b$,则存在$a$使得$r= p_1\cdots p_a \lt R$,且$p_1\cdots p_{a+1} \gt R$。这就给了$d$一个分解,即分解为$d=rq$,其中$r=p_1\cdots p_a$有$R/x^{\varpi}<r<R$
所以误差项原来是$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|$,而现在有不等式估计
$$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|\le \sum_{R/x^{\varpi}<r<R}\sum_{q}|\mathcal{E}_{rq}|$$
10.接下来用到解析数论中另外一些典型的办法,例如一些组合技巧,素数的数论函数和分解。又牵涉到一些新的参数,最后用到代数几何中的一些深刻结果。总共把误差项分为三类估计,前两类用到了Weil’s bound for Kloosterman sums,第三类用到了更深刻的由Deligne证明的Weil猜想。
(兜了不少圈子,最终证出来后,张益唐发现一些辛苦证明的结果可以从已知的Heath-Brown恒等式推出来。可是一开始宁朴勿华吧,不要想着做得多现成多漂亮,宁愿回到最原始的出发点上去,硬算一遍,以便看出很多东西。误差的第三类估计,原先也是差一点点而过不去的,但适当用了d=rq的分解后,就解决了。这是他最满意的一点。如果读他的paper,建议看第5页,上面把他的idea解释了。他个人认为解析数论仍然很有前途。)
11.陶哲轩在他的博客上发布了一个PolyMath的项目 用张益唐的新方法对Bombieri-Friedlander-Iwaniec在1986年提出的猜想(似乎是对$\{n+H_1,n+H_2,\cdots n+H_m\}$为连续的素数,$H_m-H_1$的大小最小为多少进行的猜测)进行了检验,其中有的结果假设了Elliott-Halberstam猜想和Deligne定理.不过结果是喜人的。现在(2014年1月23日成果如下)
$m$ | BFI猜想预测 | 假设EH猜测 | 未假设EH | 未假设Deligne定理 |
$1$ | $2$ | $12$ | $270$ | $270$ |
$2$ | $6$ | $270$ | $395,122 $ | $474,266$ |
$3$ | $8$ | $52,116$ | $24,462,654 $ | $32,313,878$ |
$4$ | $12$ | $474,266$ | $1,497,901,734 $ | $2,186,561,568$ |
$5$ | $16$ | $4,137,854$ | $82,575,303,608 $ | $131,161,149,090$ |
$m$ | $\small(1+o(1))m\log{m}$ | $O(m e^{2m})$ | $O(m e^{(4-\frac{52}{283})m})$ | $O(m e^{(4-\frac{43}{283})m})$ |
补充
(1)利用3中定理
设$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允许的,且若其个数$k\ge 3.5\times 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有两个素数。
可以证得\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]
推导入下:
如果$\mathcal{H}=\{q_1,q_2\cdots q_k\}$是$k$个素数构成的集合,而且每个素数都比$k$来的大,那么$\mathcal{H}$就是可允许的,这是因为不在$\mathcal{H}$的素数,显然没法构成完全剩余系,而在$\mathcal{H}$中的素数,$\mathcal{H}$元素个数又比它来的少。
素数有无穷多个,因此可以让$k\ge 3.5\times 10^6$,由3中定理可知,存在无穷多个$n$使得$n+q_1,n+q_2\cdots n+q_k$中至少有两个素数。从而就有$|n+q_i-n+q_j|=|q_i-q_j|<\infty$即证明了其有有界的间隔。
而回忆$\pi(x)$的定义:
$\pi(x)$是小于等于$x$的素数个数。
计算机计算有
\[\pi(7\times 10^7)-\pi(3.5\times 10^6)=4,118,064-250,150=3,867,941>3.5\times 10^6\]
从而可以在$[3.5\times 10^6,7\times 10^7]$之间选择$k\ge 3.5\times 10^6$个素数出来,其间隔自然小于7000万了