张益唐对于素数间隔有限研究概述 - 御坂01034

2013.8.23 张益唐先生报告之证明概要

23号下午张益唐先生受邀到校做了名为《Bounded gaps between primes and relevant problems》的报告，对他证明“存在无穷多对间隔小于7000万的素数”的思路做了大概讲述。我有幸前去听了这场报告。这篇日志里写的东西，有些我是懂的，有些不明所以，但我都尽量写清楚了，也做了一点补充。
关于张益唐先生及间隔有限的素数对的介绍，请见季理真教授的《素数不再孤单——孪生素数和一个执着的数学家张益唐的传奇》。

关于肖boss的发言以及一些美的体会请见陈张弛gg日志《【整理】素数不孤单——张益唐素数结论之肖杰表述》。
（张益唐先生说，由于在场有不少本科生，还有大一的同学，所以他不能讲得过于专业化。数论很有意思，其中很多问题，就连小学生都知道是什么，但它们的证明非常困难。另外，他建议我们有问题要经常思考，即便有些问题不一定能想出来，但要保持这个状态。）
下面开始。

1.人们（例如Goldstone, Pintz, Yildirim）在研究孪生素数猜想时已用了这样的概念：设一个有限非负整数集

\[\mathcal{H}=\{h_1,h_2,h_3\cdots,h_k\}\]

称$\mathcal{H}$是"可允许的”(admissible)，如果对任意素数$p$，存在正整数$n$，使得$p$与$P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)$互素。

（这样的$n+h_1,n+h_2\cdots n+h_k$会有比较好的性质）

例如，$\{2,3\}$不是可允许的，因为对$p=2$不满足；$\{0,2,4\}$不是可允许的，因为对$p=3$不满足；但$\{0,2\},\{0,2,6\}$都是可允许的。

2.1920年左右Hardy和Littlewood提出了这样的猜想：对于一串可允许的$\mathcal{H}$，存在无穷多个n使得$n+h_1,n+h_2\cdots n+h_k$都是素数，而孪生素数猜想正是这个猜想的特殊情况。

3.张益唐证明了如下定理：
设$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允许的，且若其个数$k\ge 3.5\times 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有两个素数。

注：由这个定理就可以推出\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]

也即存在无穷多对素数，其差小于7000万（有限！）。推导过程我放在后面的“补充”里。

4.怎么切入3中定理呢？

张益唐采用解析数论的办法。解析数论通常会处理有限和，其侧重点是怎么算这个和。有时候会用一些定义在自然数集上的“算术函数”(arithmetic function)。例如设

\[\begin{eqnarray*}
f(n) =
\begin{cases}
1 & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]

对于这样的函数，一种最自然的想法就是求和。例如如上的函数求和就有

\[\pi(x)=\sum_{n\le x}f(n)\]

其中$\pi(x)$是小于等于$x$的素数个数。

5.为什么要研究这样$f(n)$的和呢？因为我们想让一个“可允许”的几何中的素数个数大于1，也就是$\sum_{i=1}^{k} f(n+h_i)>1$对于无穷个$n$成立，这样就能间接地说明$\mathcal{H}$这个集合中有两个素数了，因为$f(n+h_k)$只能为整数。但是这样简洁明了的方法行不通，我们只好退而求其次。引入一个“权”函数$\varphi(x)$。

我们令$$S_1=\sum_{n\le x}\varphi(n),S_2=\sum_{n\le x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$。并来研究 $\frac{S_2}{S_1}$的大小。比如我们就令$\varphi(n)\equiv 1$,那么如果我们证明出来 $S_2>S_1$成立，利用鸽笼原理，立刻就能得到存在一个$n$使得$\left(\sum_{i=1}^k f(n+h_i)\right)>1$，也就是存在一个$n$,让$n+\mathcal{H}$这个集合中有两个素数。

不过直接研究对于$\sum_{n\le x}$似乎不是一个好方法，因为说不定存在的那个$n$一直是个很小的数，所以有时候会利用$\sum_{x\le n\le 2x}\varphi(n)$进行求和。比如我们还是令

$$S_1=\sum_{x\le n\le 2x}\varphi(n),S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$

这时候我们令\[\begin{eqnarray*}
f(n) =
\begin{cases}
\log{n} & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]

那么如果$S_2>\log{(3x)} S_1$,就会有 $S_1=\sum_{i=1}^k f(n+h_i)>\log{3x}$对于某个$n$成立，这样同样可以看出，存在$i,j$使得$f(n+h_i)$与$f(n+h_j)$都是大于0。我们如下的结果都是要证明后面这样一个$S_2>\log{(3x)} S_1$。

但是这些尝试的结果都不尽如人意。有人令$\varphi(n)=n,n^2,n^3$,但是都没有什么出众的结果。这个问题有很长的历史，在其中做出开拓性贡献的是Selberg。

6.既然这样一个$\varphi(n)$的权我们设为正的(如果是负的话，这些不等式估计就毫无意义了)，那么我们就可以引入一个函数$\lambda(n)$,使得$\varphi(n)=\lambda(n)^2$，现在问题就转变为寻找一个$\lambda(n)$，让它能导出证明。

而从数论中筛法的角度,Goldston,Pintz,Yildirim三人引入一个这样的$\lambda(n)$,即

\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\quad P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)\]

其中$D=x^{\varepsilon},0<\varepsilon<\frac{1}{2}$,而$\mu(n)$为Möbius函数，新的常数$\ell$与$k$有关(论文中张选取了$\ell=180$)。

从Hardy、Littlewood到 Goldston、Pintz、Yildirim，80年来才找到这个比较有用的形式。

7.计算两个和，即$$S_1=\sum_{x\le n\le 2x}\lambda(n)^2,S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\lambda(n)^2$$.

大致的计算结果是$S_1\approx T_1 (\log{x})^{k+2\ell},S_2\approx T_2 (\log{x})^{k+2\ell}+O(\mathcal{E})$，其中$O(\mathcal{E})$是误差项。

Goldston等人得出了这样的结果:即在(上述常数$D$中用到的)$\varepsilon<\frac{1}{4}$时，$S_2-(\log{3x})S_1$为负数，显然不能满足要求，但如果$\varepsilon=\frac{1}{4}+\varpi$,虽然$T_2>\log{(3x)} T_1$,但是这两者相减的误差项却很难估计。所以他们三人就止步于此了。

（PS:即使“广义黎曼假设”是对的，在这里也没有帮助）

8.张益唐的想法是对$\lambda(n)$进行一些调整，在式子

\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\]

中，有些$d$对$\lambda(n)$的贡献其实很小，所以很小的应该和很大的区分开来。考虑使$\mu(d)!=0$的数$d$，比如如果它有$>x^{1/10}$的因子，那么实际上它对整个序列的和的贡献（即对$\lambda(n)$的贡献）是很小的。我们可以把所有含有因子大于$x$的某个幂次的数“筛”掉，余下来的就是贡献比较大的数了（也许你会问，没筛掉不是会更大吗？实际上，没筛掉的话会对整个和每一项的估计都变少，从而影响整个数列的和）。

张益唐选取的是$\varpi=\frac{1}{1168}$,也就是$D=x^{\frac{1}{4}+\varpi}$,而且拥有大于$x^{\varpi}$的素因子的数将会被“筛”掉。

（张益唐这时提到了杨振宁先生说过的关于治学的话：“宁拙毋巧，宁朴勿华。”开始研究的时候宁愿“笨拙”一点，Goldston等人在计算中采用了比较漂亮的办法，而张益唐用了一些比较原始的办法，算出了同样的结果，同时有了更细致的观察）

所以如上的$\lambda$也就变成了

\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|(P(n),\mathcal{P}),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell},\quad \mathcal{P}=\prod_{p<x^{\varpi}}p\]

9.而最关键的东西来了！现在对应的误差项是可以估计出来的！假如$d$满足$x^{\frac{1}{2}-\epsilon}<d<D^2,d|(P(n),\mathcal{P})$（其中$\epsilon$是一个很小的正常数）,我们可以看出来它的素因子相当小，但是$d$又很大，所以它素因子个数很多。

我们再给定一个正常数$R<d$,对于$d = p_1\cdots p_b$,则存在$a$使得$r= p_1\cdots p_a \lt R$,且$p_1\cdots p_{a+1} \gt R$。这就给了$d$一个分解，即分解为$d=rq$,其中$r=p_1\cdots p_a$有$R/x^{\varpi}<r<R$

所以误差项原来是$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|$,而现在有不等式估计

$$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|\le \sum_{R/x^{\varpi}<r<R}\sum_{q}|\mathcal{E}_{rq}|$$

10.接下来用到解析数论中另外一些典型的办法，例如一些组合技巧，素数的数论函数和分解。又牵涉到一些新的参数，最后用到代数几何中的一些深刻结果。总共把误差项分为三类估计，前两类用到了Weil’s bound for Kloosterman sums，第三类用到了更深刻的由Deligne证明的Weil猜想。

（兜了不少圈子，最终证出来后，张益唐发现一些辛苦证明的结果可以从已知的Heath-Brown恒等式推出来。可是一开始宁朴勿华吧，不要想着做得多现成多漂亮，宁愿回到最原始的出发点上去，硬算一遍，以便看出很多东西。误差的第三类估计，原先也是差一点点而过不去的，但适当用了d=rq的分解后，就解决了。这是他最满意的一点。如果读他的paper，建议看第5页，上面把他的idea解释了。他个人认为解析数论仍然很有前途。）

11.陶哲轩在他的博客上发布了一个PolyMath的项目用张益唐的新方法对Bombieri-Friedlander-Iwaniec在1986年提出的猜想(似乎是对$\{n+H_1,n+H_2,\cdots n+H_m\}$为连续的素数，$H_m-H_1$的大小最小为多少进行的猜测)进行了检验，其中有的结果假设了Elliott-Halberstam猜想和Deligne定理.不过结果是喜人的。现在（2014年1月23日成果如下）

$m$	BFI猜想预测	假设EH猜测	未假设EH	未假设Deligne定理
$1$	$2$	$12$	$270$	$270$
$2$	$6$	$270$	$395,122 $	$474,266$
$3$	$8$	$52,116$	$24,462,654 $	$32,313,878$
$4$	$12$	$474,266$	$1,497,901,734 $	$2,186,561,568$
$5$	$16$	$4,137,854$	$82,575,303,608 $	$131,161,149,090$
$m$	$\small(1+o(1))m\log{m}$	$O(m e^{2m})$	$O(m e^{(4-\frac{52}{283})m})$	$O(m e^{(4-\frac{43}{283})m})$

补充

（1）利用3中定理

设$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允许的，且若其个数$k\ge 3.5\times 10^6$,那么存在无穷个$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有两个素数。

可以证得\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]

推导入下：

如果$\mathcal{H}=\{q_1,q_2\cdots q_k\}$是$k$个素数构成的集合，而且每个素数都比$k$来的大，那么$\mathcal{H}$就是可允许的，这是因为不在$\mathcal{H}$的素数，显然没法构成完全剩余系，而在$\mathcal{H}$中的素数，$\mathcal{H}$元素个数又比它来的少。

素数有无穷多个，因此可以让$k\ge 3.5\times 10^6$,由3中定理可知，存在无穷多个$n$使得$n+q_1,n+q_2\cdots n+q_k$中至少有两个素数。从而就有$|n+q_i-n+q_j|=|q_i-q_j|<\infty$即证明了其有有界的间隔。

而回忆$\pi(x)$的定义：

$\pi(x)$是小于等于$x$的素数个数。

计算机计算有

\[\pi(7\times 10^7)-\pi(3.5\times 10^6)=4,118,064-250,150=3,867,941>3.5\times 10^6\]

从而可以在$[3.5\times 10^6,7\times 10^7]$之间选择$k\ge 3.5\times 10^6$个素数出来，其间隔自然小于7000万了

posted on 2014-01-22 22:54 御坂01034 阅读(6426) 评论(2) 编辑收藏举报

刷新页面返回顶部