【校理】为了人类心智的荣耀
转载说明
来源:http://blog.renren.com/share/319963549/17768438992
说明:在网上搜索,查得原博主似乎昵称为“学术状态帝”,在其日志界面中没有找到这篇文章,仅得在人人网的热门日志栏目找到转载的版本(没有显示作者)。原来格式一般,且公式均为图片,我读完后手敲一遍$\LaTeX$公式并作了简单的排版,仅供读者参考。
零.
最近在啃一本数学书(GTM228, A First Course in Modular Forms,强推),第一次领略到了整个数学大厦的壮丽宏伟,特此记录一例,希望能与你分享到同样的风景。本来这种学术文我是想在Blog上打的,但是那就意味着我得精益求精的打一篇文章,这工作量太大了,所以就在人人上粗糙的打一下吧……
一.
拉格朗日证明了每个正整数都可以表示成4个整数的平方和(我记得这段历史似乎还和费马有关,但记得依稀不那么真切了=.=),现在我们考虑这样一个问题:若要将正整数n写成4个整数的平方和,有多少种写法呢?
更一般的,若要将n写成k个整数的平方和(有序,正负算2个),有多少种写法呢?
比如$1 = 0^1+1^2 = 0^2 + (-1) ^2 = 1^2 + 0^2 = (-1)^2 + 0^2$,共有4种写法。
表面看上去,这是一个纯粹的数论问题,而且似乎无从下手。然而数学家的工作就是揭示抽象世界的内在联系,这个问题也最终通过一个看似风马牛不相及的方法得到了解决。沿途,无数idea闪耀,各个数学分支交错纵横融会贯通,回头看来着实壮丽。
1.1
首先,我们记$r(n,k)$为把正整数$n$写成$k$个整数平方的和的方法数,我们就是要求它。不难发现,$r(n,k)$等于所有$r(s,i)r(t,j)$的和,其中$i+j=k$固定,$s+t=n$取遍所有正整数。
$$r(n,k)=\sum_{s+t=n\\s,t>0}r(s,j)r(t,j)~\mbox{for some}~i+j=k.$$
注意到这个关系很像多项式乘法,所以我们考虑构造一个函数,所谓生成函数:
$$\theta(\tau,k)=\sum_{n=0}^\infty r(n,k)q^n~\mbox{where}~q=e^{2\pi i\tau},\tau\in\mathcal{H},$$
这里$\tau$是变量,$k$是参数。其中变量$\tau$取值在上半(复)平面。等式右边是展开成的Fourier级数。如果我们能通过另一种方法再得到这个函数的Fourier展开的话,对比一下系数,$r(n,k)$就求出来了。
下面的剧情就真的像神一样展开了。我不太相信数学家是因为这个问题而发展出下面一套理论的,反过来,应该是理论建立好后发现可以解决上面那个小问题。所以我这里的叙述应该和历史是反的。
首先,由之前$r(n,k)$与$r(s,i)r(t,j)$的关系,不难发现如下等式成立(当然严谨的证明,需要证明那个级数是绝对收敛的,不然不能交换次序,不过这里就不涉及技术细节了):
$$\theta(\tau,k_1)\theta(\tau,k_2)=\theta(\tau,k_1+k_2).$$
所以,如果我们把$\theta(\tau, 1)$求出来后,$\theta(\tau, n)$也就知道了,或至少有一定信息了。
下面,我们考察一下函数$\theta$,看看它有什么不变性。
一个不难发现的等式是:
$$\theta(\tau+1,k)=\theta(\tau,k).$$
另一个很难发现的等式是:
$$\theta(\frac{\tau}{4\tau+1},1)=\sqrt{4\tau+1}\theta(\tau,1).$$
从而
$$\theta(\frac{\tau}{4\tau+1},k)=(4\tau+1)^{k/2}\theta(\tau,k).$$
立刻会让人想到一个东西:所谓模形式,modular form。
1.2
在这之前,先还要介绍两个概念:群和线性空间,我本想偷懒绕开他们,但发现绕不开=.=。
粗糙的说,所谓一个群,就是一个元素间可以做运算的集合。比如集合{黄瓜,苹果},就是光秃秃的一个集合。但如果我们定义:黄瓜@苹果=黄瓜,黄瓜@黄瓜=黄瓜,苹果@苹果=苹果,那么这个集合就在“@运算”下构成了一个群。当然这个运算是要满足一些性质的,这里就不多说了。
所谓线性空间——我们这里就只考虑复数(域)上的线性空间吧——首先它本身是一个群(应该是交换群,就是群上的运算满足交换律),然后它还能跟复数做乘法,得到的结果还在那个群里。比如所有复数值的n个分量的向量,就构成了一个复数域上的线性空间。关于线性空间最关键的一点是,它有一组基,使得其中所有元素都能用这组基表达出来。这组基的个数称作空间的维数。比如$(1,0),(0,1)$就是实数域上2维实数值向量构成的线性空间的一组基。
粗略介绍了如上两个概念后,我们来介绍模形式。
模形式的定义细节有3条,两条是说函数在上半平面全纯(不解释=.=,就理解成“性质很好”吧)以及在无穷点全纯。剩下一条描述了其在一个矩阵群作用下的“几乎不变性”:
$$f(\gamma(\tau))=(c\tau+d)^kf(\tau)\mbox{for any}\gamma=\begin{pmatrix}a&b\\c&d\end{pmatrix}\in\Gamma\subset SL_2(\mathbb{Z}).$$
其中SL2(Z)是所有元素取整数、行列式为1的矩阵的集合,$\Gamma$是它的一个满足一定条件的子集,具体满足什么条件这里也先不着急说。。。
我们把满足上述条件的f称作关于$\Gamma$的$k$阶模形式,它们在$\Gamma$的作用下几乎不变,仅仅是多了一个系数。将它们的全体构成的集合记做$\mathcal{M}_k(\Gamma),$不妨称之为模形式空间(或严密地说,关于$\Gamma$的$k$阶模形式空间)。
我们发现任意两个$M_k(\Gamma)$中的元素$f,g$,它们的和也在其中,且任意一个复数$z$乘上$f$后,$zf$也在其中。所以我们发现$M_k(\Gamma)$构成了一个复数域上的线性空间。
在回到之前求$r(n,k)$的问题。在那里事实上我们发现了$\theta(\tau,k)$在如下四个矩阵的作用下满足$k/2$阶模形式的要求:
$$\pm\begin{pmatrix}1&1\\0&1\end{pmatrix},\pm\begin{pmatrix}1&0\\4&1\end{pmatrix}.$$
所以$\theta(\tau,k)$关于这两个元素“生成”的群成为了$k/2$阶模形式。
所谓由几个元素生成的群,就是将所有能通过这些元素间的运算得到的东西汇集在一起构成的集合,它在原运算下仍然是一个群。比如这里,就是这四个矩阵随意做乘法,求逆,再乘法,再求逆等等,最后将所有得到的结果放在一起,构成一个群。
那么由这4个矩阵生成的群究竟是什么呢?可以证明它是下面这个东西:
$$\Gamma_0(4)=\{ \begin{pmatrix}a&b\\c&d\end{pmatrix} \in SL_2(\mathbb{Z}):\begin{pmatrix}a&b\\c&d\end{pmatrix}\equiv\begin{pmatrix}\ast&\ast\\0&\ast\end{pmatrix}(\mathrm{mod~}4)\}.$$
就是$SL_2(\mathbb{Z})$中所有左下角元素为4的倍数的那些矩阵构成的群。
出于之后将会明了的原因(for the reason which will be clear soon...=.=),我们再考虑下面这个特殊一点的子群:
$$\Gamma_1(4)=\{ \begin{pmatrix}a&b\\c&d\end{pmatrix} \in SL_2(\mathbb{Z}):\begin{pmatrix}a&b\\c&d\end{pmatrix}\equiv\begin{pmatrix}1&\ast\\0&1\end{pmatrix}(\mathrm{mod}~4)\}.$$
由上面的分析,我们有
$$\theta(\tau,k)\in\mathcal{M}_k(\Gamma_0(4))\subset\mathcal{M}_k(\Gamma_1(4)).$$
前面已经说过,模形式空间是一个线性空间,所以若果能找到它们的维数,以及相应的一组基,就能表达出$\theta$了,进而就能知道每一个Fourier展开的系数是什么了,从而$r(n,k)$就知道了!而之所以这里考虑$\Gamma_1$而不是$\Gamma_0$,是后来发现关于$\Gamma_1$的空间的维数公式和基都能有很漂亮的表达式。
那么,要怎么求出模形式空间的维数和基呢?
这又是一段信息量极大的跌宕起伏的故事……
1.3
如果下把下文中出现的所有名词一一解释,那本文篇幅就将无限长了,所以如果你碰到了没见过的名词,就默认它很高端,然后跳过就好了=.=。。。
首先,注意到对于0阶模形式,它实际上就是在$\Gamma$中元素作用下不变的函数,这样一来,虽然这样的函数$f$是定义在上半平面$H$上的,我们可以将其视为定义在$H$模掉$\Gamma$的商空间上的。
我觉得这个思想非常漂亮,这里解释一下什么叫“模掉”(厄,至少我这么读,但愿正规读法也是这样=.=)。比如我们有一个函数f,定义域是6个人:S={韩旭,韩九,韩日,小明,小花,小草},然后碰巧f的取值满足f(韩旭),f(韩九),f(韩日)都等于0,f(小明),f(小花),f(小草)都等于1,那么我们可以将f视为作用在两个“东西”上,一个是姓韩的人全体,一个是姓小的人全体,这个新的函数的定义域就是S模掉{姓}。总之,当你需要将一堆东西视为一个整体时,就模掉一个关系。当然,具体的数学表述没这么粗糙,涉及到一些概念,就不详述了。
我们记$Y(\Gamma)=\mathcal{H}/\Gamma$为上半平面模掉$\Gamma$后得到的东西。可以为它附上一个拓扑(不解释=.=),变成一个拓扑空间。
我们可以证明,这个空间是Hausdorff的(不解释=.=),且可以附上一个atlas(不解释=.=),从而它便成为了一个黎曼流形(不解释=.=)(似乎作为流形还需要满足第二可数性(不解释=.=),不过由于上半平面显然是满足的,所以这一点没有问题)。
可是这个流形并不让人满意,因为它不是紧的(不解释=.=)。不过没关系,我们可以将它紧化(不解释=.=),得到一个紧的黎曼流形,记为$X(\Gamma).$为什么要费这么大周折呢?因为关于紧的黎曼流形,有一堆很好的性质,以及一堆现成的结论可以利用。其中一个我们将要用到的是所谓Riemann-Roch定理。在叙述它之前,我们还得先引入一些概念=.=(for the reason will be clear soon =.=)
首先,在一个紧黎曼流形X上定义一个所谓divisor的东西,它是如下的有限的“形式和”,即一个没有任何意义的和式:
$$D=\sum_{x\in X}n_xx,n_x\in\mathbb{Z},n_x=0~\mbox{for all but finite}x.$$
对于每一个定义在一个紧黎曼流形上的非零的半纯(不解释=.=,简单地说,就是可以取值为无穷的函数)函数$f$,我们都可以定义出一个divisor:
$$\mathrm{div}(f)=\sum_{x\in X}v_x(f)x,$$
其中$v_x(f)$是$f$在每一个点处的阶(不解释=.=)。由复分析我们知道,$f$只有在其零点(值为0的点)和极点(值为无穷的点)处有非零的阶,而紧的黎曼流形上,半纯函数的零点和极点必为有限个,所以上面的$\mathrm{div}(f)$是well-defined的。
在$X$上的两个divisor之间,我们可以定义一个序关系(就是可以比较大小),我们说$D_1>=D_2$,指的是$D_1$的每一个$n_x$都大于$D_2$的相应的$n_x$。以及一个加法,就是对应的$n_x$加起来。
进而,对于每一个$X$上的divisor $D$,我们考虑如下这个集合:
$$L(D)=\{f\in C(X):f=0~\mbox{or}~\mathrm{div}(f)+D\geq0,\}$$
其中$C(X)$表示$X$上的半纯函数全体。不难发现,这个$L(D)$是一个复数域上的线性空间,这一点和模形式空间是一样的哦……
我们记$\mathrm{deg}(D)=\sum_{x\in X}n_x$表示$D$的“度”。
现在我们站到比模形式空间稍微大一点的空间中去看一下,所谓automorphic form(我不知道怎么翻译了=.=)。它和模形式的不同在于,它仅要求半纯而不是全纯,符号用$A$而不是$M$来表示。
不难发现,如果$f,g$是$X$上的同阶的automorphic form,那它们的商$f/g$是就是0阶的automorphic form,进而就是$X$上的半纯函数,反之亦然。所以我们得到:
\begin{align*}\mathcal{A}_k(\Gamma)&=\{f_0f\in\mathcal{A}_k(\Gamma):f_0f=0\mbox{or}\mathrm{div}(f_0f)\geq0\}\\&\cong\{f_0\in C(x(\Gamma)):f_0=0~\mbox{or}~\mathrm{div}(f_0)+\mathrm{div}(f)\geq0\}\\&=\{f_0\in C(X(\Gamma)):f_0=0~\mbox{or}~\mathrm{div}(f_0)+\left \lfloor\mathrm{div}(f)\right\rfloor\geq0\}\\&=L(\left\lfloor\mathrm{div}(f)\right\rfloor)\end{align*}
其中关于divisor的向下取整是对每一个$n_x$取整,至于为什么要取整,是为了用到后面将要利用的定理。这里的$f$是$X(\Gamma)$上的一个给定的automorphic form。可能你注意到了一个问题,前面说过,当$f$是0阶模形式(这里是automorphic form,不过结论一样)时,它在$X(\Gamma)$上是良定义的。但是对一般的$k$阶形式,它却不是良定义的,怎么能定义$\mathrm{div}(f)$呢?不用怕,虽然整个$f$是无法定义的,但是$f$在紧黎曼流形$X(\Gamma)$上每一点的“阶”是可以well-defined的,所以还是可以写出$\mathrm{div}(f)$。而这已经足够了。
总之,我们得到了一个很漂亮的结论(这里的同构是复线性空间的同构):
$$\mathcal{M}_k(\Gamma)\cong L(\left\lfloor\mathrm{div}(f)\right\rfloor.$$
于是,求$M_k$的维数,就变成了求右边的空间的维数了。其中这里的$f$是任意给定的。
1.4
现在我们终于来看一看为什么要考虑上面这一堆天马行空的东西了,只为了能够应用这个定理,所谓Riemann-Roch定理(这里说它的一个特殊形式):令$X$为一个紧的黎曼流形,亏格(不解释=.=)为$g$,那么对于$X$上的任意一个divisor $D$,如果$\mathrm{deg}(D)>2g-2$,我们有
$$l(D)=\mathrm{deg}(D)-g+1.$$
其中$l(D)$表示线性空间$L(D)$的维数。令$D$等于$[\mathrm{div}(f)]$,我们便可以得到$M_k$的维数了!当然,具体怎么求$\mathrm{deg}([\mathrm{div}(f)])$呢?这将又是一篇长篇大论,我是在是。。打。打不动。了。。了。所以。此处省略几千字吧。
总之,最后我们可以得出,
\begin{align*}\mathrm{dim}(\mathcal{M}_1(\Gamma_1(4)))&=1\\ \mathrm{dim}(\mathcal{M}_2(\Gamma_1(4)))&=2\\ \mathrm{dim}(\mathcal{M}_3(\Gamma_1(4)))&=2\\ \mathrm{dim}(\mathcal{M}_4(\Gamma_1(4)))&=3\end{align*}
1.5
再回到最初的那个整数平方和的问题,别忘了
$$\theta(\tau,2)\in\mathcal{M}_1(\Gamma_1(4)).$$
(就以它为例吧,因为这个空间是1维的)所以只要找到右边这个1维空间的一个基,特别的,就是其中的一个非零函数,$\theta(\tau, 2)$与它最多相差一个复系数!
至于怎么找到这一组基呢?这又是一篇长篇大论,涉及无数人命函数以及巧妙的构造,就不详述了,下面仅列出一些其中用到的人名函数来膜拜一下……
Eisenstein series:
$$G_k(\tau)=\sum_{(c,d)\in\mathbb{Z}^2}\frac{1}{(c\tau+d)^k},\tau\in\mathcal{H}.$$
Riemann zeta function:
$$\zeta(s)=\sum_{n=1}^\infty\frac{1}{n^s},~\mathrm{Re}(s)>1.$$
Hurwitz zeta function:
$$\zeta_{+}^n(s)=\sum_{m=1\\m\equiv n(N)}\frac{1}{m^s},~n\in\mathbb{Z}_N^\ast.$$
Mobius function:
$$\mu(n)=\begin{cases}0,~&\mbox{if}~p^2|n~\mbox{for some prime}~p\\(-1)^g,~&\mbox{if}~n=p_1\cdots p_g~\mbox{for distinct primes}\end{cases}$$
Dirichlet character: 一个乘法群的同态
$$\chi=:\mathbb{Z}_N^\ast\rightarrow\mathbb{C}$$
Gamma function:
$$\Gamma(s)=\int_0^\infty e^{-t}t^{s-1}\mathrm{d}t,~s\in\mathbb{C},\mathrm{Re}(s)>0.$$
Dirichlet L-function:
$$L(s,\chi)=\sum_{n=1}^\infty\frac{\chi(n)}{n^s},~\mathrm{Re}(s)>1.$$
Weierstrass sigma-function:
$$\sigma_\Lambda(z)=z\prod_{0\neq\omega\in\Lambda}(1-\frac{z}{\omega})e^{\frac{z}{\omega}+\frac{1}{2}(\frac{z}{\omega})^2}.$$
……实在是列不动了。。。
总之,经过这些神一样的人物神一样的“注意到”,“考虑如下”,构造、运算、化简之后,我们终于能给出$M_1(\Gamma_1(4))$的一个基了(别忘了,它是一维的。):$E_1^{\chi,\mathbf{1}}.$
这是什么玩意?
这是一个函数,指数是两个Dirichlet character,第二个是平凡homomorphism。它的一般定义是这样的:
$$E_1^{\psi,\varphi}(\tau)=\delta(\varphi)L(0,\psi)+\delta(\psi)L(0,\varphi)+2\sum_{n=1}^\infty\sigma_0^{\psi,\varphi}(n)q^n.$$
别怕,我们只要关注非常数项就好了,因为$r(n,k)$中的$n$是从1开始的。它的定义是
$$\sigma_{k-1}^{\psi,\varphi}=\sum_{0<m|n}\psi(\frac{n}{m})\varphi(m)m^{k-1}.$$
由这一个基$E$和之前$r(n,2)$的生成函数,对比系数我们便得到
$$r(n,2)=C\sigma_0^{\chi,\mathbf{1}}(n),$$
其中$C$为一个复常数,由$r(1,2)$可以定出。
最终,经过不繁但是让人望而生畏的计算后,我们得到
$$r(n,2)=4\sum_{0<m|n\\m~\mbox{odd}}(-1)^{\frac{m-1}{2}},$$
同样我们还能得到(对$k=4$有快一点的办法)
$$r(n,4)=8\sum_{0<d|n\\4\nmid d}d.$$
对于更大的(偶数)$k$呢。。。当然也可以算啦。。你有兴趣就算去呗。。算去呗。。去呗。。呗。。。
二.
打的我真要吐血了。终于把数学部分打完了。
我一直以来有一个想法,希望能将高深的数学通俗的介绍给大众,让大家能欣赏到数学的美。
为什么呢。
因为整个中国初等教育,只让人们看到了数学最丑的一面。
这一点在之前一篇《中国人为什么数学不算厉害》(类似的名字,具体的我忘了=.=)中表达的很好了。我就不多说了。
很多人苦于解方程,算行列式,求导求积分,背定理背公式,等等。苦不堪言。
特别是期末考试期间,无数状态、日志在吐槽数学。。。
我觉得关键在于,整个数学教育,没有让学生从宏观上看到数学的结构,欣赏到其美丽,而只追求细枝末节的东西。
打个比方,就像爬山。考虑两种方案:
1)如果我带你爬山之前,先用直升飞机带你慢慢的飞到山顶,让你先欣赏一下沿途的风景以及从山顶往山下俯瞰的美景,再带你从头开始爬。
2)我告诉你我们去爬一个不知名的山吧!然后从山脚开始费力的攀登。
这两种,哪一种好呢?显然对于第一种,你会怀有一种期待与激情快乐地努力攀登,而第二种,你根本顾不上欣赏沿途的美景,也不知道前方是什么鬼东西,稍有一点困难可能就想下山了。
教育也是如此。
当然你可以说数学教育有其特殊性,很多因果关系必须反过来讲,比如一个定义的出现是由后面的一堆“考虑”导致的,而那些“考虑”还真没办法先说。的确,我在打第一部分的时候也纠结过这个问题。但让学生提前知晓一个大的方向,知道最终要做什么,或至少举一个应用的例子,我想总是可以做到。比如就是那个求$r(n,k)$的例子,支撑着我耐着性子看完了一堆密密麻麻的积分号和sigma,如果没有它,我早就把书一扔不干了。
另外,我不得不承认,跟一个外行讲数学的确太难了。
若要和一个新手完整的介绍一个概念,比如域上的线性空间,我得先介绍Abel群,以及域。于是我还得先介绍群……这还算好的,要是一个更大一点的概念,比如流形,那预备知识将是指数级的=.=。
另外,有一些东西,懂的人能明明感觉到其精髓,但是要真解释清楚着实不易。
比如上文的那个divisor,我觉得它无非就是为了描述一个函数在每个点的degree,创造的一个方便的工具。但要是真的把另一个人讲懂,着实不易,所以很多数学书只罗列定理定义恐怕尤其原因吧。
超出语义所能表达的界限的东西,才是智慧所在。
正如维特根斯坦所说,凡不可说者,我们必须保持沉默。
所以把数学通俗的介绍给大众,不知能不能做到。
三.
我们兜了一大圈,足迹遍布数论、复分析、几何、拓扑、代数,终于得到了最初的那一个问题的答案。
但是请回过头来想一想,“问出”这一个问题,需要些什么?
需要数论,需要复分析,需要几何,需要拓扑,需要代数,吗?
完全不需要!需要的就是一个最基本的东西——每个人生而熟知的——自然数。
一个小孩,只要它能数数,能认知到2个皮球和3个皮球合到一起是5个皮球——当然他不一定读做2、3、5,它就能提出文章开头的问题。你可能要说他不会算平方啊!可是平方无非就是正方形数——欧几里得他们不都是这样来看待这些数的嘛。
甚至一个会数数的狗(事实上我们人类怎么能肯定狗不会数数呢),也能提出相同的问题,只不过它可能会把1读成“汪”。
这说明什么?
说明人类与生俱来的(关于数的)认知本身中有着其intrinsic的结构与性质。而整个数学,特别是那些“纯”数学,就是在以人类卑微的智慧来试图破解这其中的奥秘。
数学家们花了上千年,在不同方向上建立了风格迥异的数学分支。但到头来它们竟然能融会贯通,纵横交错,联合在一起给出了关于整数的一个最基本的问题的答案,这又说明什么?
说明:
1)数学家们的工作似乎没做错。不然两个分支撞在一起矛盾了就麻烦了。
2)整个数学并没有还原出那个与生俱来的intrinsic的结构的本来面貌。肯定还有一个更基本更底层的结构不为人所知。
或许整个宇宙就是被设计成我们只能生活在其中,或许有天才还没有出生。
犹记得以前看过一篇文章,说代数里的所谓魔群和另一个分支里(忘了是什么了)的一个东西联系在一起,最终在物理的超弦理论中合二为一。
我想这正反映出了上述观点:我们的整个理论并不是基本的,仅仅是浮于表面的一块块补丁,在衔接处幸运的接合的很好。
四.
最后。相信你肯定会忍不住要问:
你算出了$r(n,k)$有什么用啊?为什么要算它啊?
的确,它能赚钱吗?
不能。
它能帮你换到房子,搞到车子吗?
不能。
它能帮你找到妹子吗?
不能。T.T
那为什么要研究它呢??!!
为了人类心智的荣耀。
趁现在衣食无忧,不用为生计发愁,多欣赏欣赏吧。无论什么学科。
不知道几年后,还有没有时间、精力和心情啃一本书了。
本博客上不以【校理】字样作为标题的文章,其著作权均归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
本人为西安交通大学能动学院本科生,欢迎对相关内容提出批评与建议!
Github个人主页:https://github.com/xjtu-blacksmith/
欢迎关注西安交大钱院学辅信息站:https://qyxf.site/
邮箱:yjr134@163.com