一.变分原理
变分原理始于17世纪的速降问题,也就是连接两点的曲线在有重力的情况下,让初速度为0的一小球最快地通过?
这个问题由伯努力给出解答,他的方法非常巧妙,而最后开创了一个学科——变分学。他假设$y=y(x)$是最终所得曲线(假设我们在一个二维空间中,$x$为横坐标,$y$为纵坐标),在$x$时的速率为$v$,那么下滑$ds$所用时间为$ds/v$。由于能量守恒,也就是$\frac{1}{2}mv^2=mg y(x)$。那么$v=\sqrt{2g y(x)}$,而$ds=\sqrt{1+\dot{y}(x)^2}dx$。伯努力指出,所求曲线应该是泛函$t_{12}$的“临界曲线”,也就是给定$y_1,y_2$后,让$$t_{12}=\int_{x_1}^{x_2}\sqrt{1+\dot{y}(x)^2}dx$$最小的$y$。找到这个$y$就如同微积分中找到一个函数的临界点,如果我们加上一个小量都比它大的话,那么这个就是临界点。同理,我们的变分问题就变为$$0=\left.\frac{\delta t_{12}}{\delta y}\right|_{y=y_0}=\lim_{\epsilon\to 0}\frac{t_{12}(y_0(x)+\epsilon h(x))-t_{12}(y_0(x))}{\epsilon}.$$这个方程被称为Euler-Lagrange方程。变分原理,用最粗糙的语言描述就是
变分原理(狄利克雷原理)在物理或几何问题中,质子运动方程或方式是以“最省力”的方法进行。也即它满足相应泛函的Euler-Langrange方程!
比如说对于无外力作用下的欧氏空间中,两点之间的最短分段可微曲线$\gamma(t)$可以用如下方法计算:即对于能量泛函$$S(\gamma)=\frac{1}{2}\int_a^b (\sum_{j=0}^n \gamma'(t)^2)dt,$$相应的Euler-Lagrange方程就是$$0=\lim_{\epsilon\to 0}\frac{1}{2}\int_a^b \frac{\langle \gamma'+\epsilon h',\gamma'+\epsilon h'\rangle- \langle \gamma',\gamma'\rangle}{\epsilon}dt=-\int_a^b\langle \gamma''(t),h(t) \rangle dt$$对于任意的$h$都成立,那么就是$\gamma(t)=\vec{a}+t\vec{b}$为两点之间最短的路线,也就是直线。$\newcommand{\sgn}{\operatorname{sgn}}$
二.Yang-Mills方程
为了给出Yang-Mills方程我们给出所谓的Hodge$*$算子。设$V$为一个$n$维欧氏空间,有内积度量,选取单位正交基$\{e_1,e_2,\ldots,e_n\}$,它的Grassmanian代数记为$\wedge^* V$,$p$次外代数记为$\wedge^p V$。那么Hodge引入了$*$算子$$e_{i_1}\wedge\ldots \wedge e_{i_p}\mapsto (-1)^{\sgn(i_1,\ldots,i_p,j_1,\ldots,j_{n-p})}e_{j_1}\wedge e_{j_{n-p}}.$$其中$\{i_1,\ldots,i_p,j_1,\ldots,j_{n-p}\}$是$\{1,2,\ldots,n\}$的一个排列。由此可见
性质1:$**:\wedge^p\to\wedge^p$有$**=(-1)^{np+p}id$这个由简单计算可知
性质2:$*1=\sqrt{\det(g_{ij})}dx^1\wedge\ldots,\wedge dx^n$
这是由于,在坐标系$(x^1,\ldots,x^n)$下,度量$ds^2=g_{ij}(x)dx^i dx^j,g_{ij}=\langle \frac{\partial}{\partial x^i},\frac{\partial}{\partial x^j}\rangle$。我们仅验证$n=2$的情况。即$$ds^2=g^{11}(dx^1)^2+2g^{12}dx^1dx^2+g^{22}(dx^2)^2$$在$x\in M$的余切空间$T_x^*M$上,我们找一组正交基$w_1=\frac{1}{\sqrt{g^{11}}}dx^1,w_2=adx^1+bdx^2$。而正交性表明$$w_2=-\frac{g^{12}}{\sqrt{\det(g^{ij})\cdot g^{11}}}dx^1+\frac{\sqrt{g^{11}}}{\sqrt{\det(g^{ij})}}dx^2$$
从而$w_1\wedge w_2=\sqrt{\det(g_{ij})}dx^1\wedge dx^2$,由于$1/\det(g^{ij})=\det(g_{ij})$。
我们由此可以引入内积$\forall \phi,\psi\in\wedge^p$,$\langle \phi,\psi\rangle :=\int_M(\phi\wedge *\psi)$。有了内积就有对偶,对于外微分算子$\wedge^{p-1}\to\wedge^p$我们定义它的对偶$d^*$满足$\langle d\phi,\psi\rangle=\langle \phi,d^*\psi\rangle$。
引理 $d^*=(-1)^{np+n+1}*d*:\wedge^p\to\wedge^{p-1}$
证明:由于$\forall \phi\in\wedge^{p-1},\psi\in\wedge^p$我们有$$\langle d\phi,\psi\rangle=\int_M(d\phi)\wedge(*\psi)=(-1)^p\int_M\phi\wedge d*\psi.$$由于$d*\psi$为$n-p+1$形式,那么有$**d*\psi=(-1)^{n(n-p+1)+(n-p+1)}id$。即$$\langle d\phi,\psi\rangle=\int_M\phi\wedge *((-1)^{np+n+1}*d*\psi).\quad\square$$
从而我们可以研究Yang-Mills泛函的Euler-Lagrange方程,故而有如下定理
定理1 Yang-Mills泛函的Euler-Lagrange方程是$D_A^* F_A=0$,其中$D_A=d+A$(称为Yang-Mills方程)
证明:对于联络$D_A=d+A$的变分$A+\epsilon B$我们有对于$\forall s$ $$F_{A+\epsilon B}s=(D_A+\epsilon B)(D_A+\epsilon B) s=D_A^2 s+\epsilon(D_A B) s+\epsilon^2 B\wedge B s.$$其Euler-Lagrange方程为$$0=\frac{d}{d\epsilon}(YM(D_{A+\epsilon B}))|_{\epsilon=0}=\int_{\mathbb{R}^n}\langle F_A,D_A B\rangle *1=\int_{\mathbb{R}^n}\langle D_A^* F_A,B\rangle *1$$
也就是$D_A^* F_A=0$。$\square$ $\newcommand{\R}{\mathbb{R}}$
例子 对于平坦$\R^n$中的欧氏度量$g_{ij}=\delta_{ij}$,我们考察Yang-Mills方程:对于联络$A=A_k dx^k$,其曲率为$F_A=F_{ij} dx^i dx^j$,其中$F_{ij}=\partial_i A_j-\partial_j A_i+[A_i,A_j]$。注意到$(D_A B)s= D_A(B s)+B\wedge (D_A s)=(dB+[A,B])s$,从而$D_A^* F_A=(-1)^{\ldots}*D_A*F_A=0$即为$D_A(*F_A)=0$。
故而$$d(*F_A)+[A,*F_A]= (-1)^{\sgn(i,j,k_1,\ldots,k_{n-2})}\left(\frac{\partial F_{ij}}{\partial x^k}+[A_k,F_{ij}]\right)dx^k\wedge \bigwedge_{i=1}^{n-2}dx_{k_i}=0$$由于$k=i$或$j$方程才有意义,所以划归为$$\left\{\begin{array}{lr}\frac{\partial F_{ij}}{\partial x^i}+[A_i,F_{ij}] & =0\\\frac{\partial F_{ij}}{\partial x^j}+[A_j,F_{ij}] & =0 \end{array}\right.$$
注:这里$[A,B]=AB-(-1)^{\tau(B)}BA$,其中$\tau(B)$为$B$的奇偶性。奇数为1,偶数为0.
三.电磁场里的Maxwell方程组
由于$D_AB=dB+[A,B]$,我们断言$D_A F_A=0$。这是由于$d F_A=d(dA+A\wedge A)=dA\wedge A-A\wedge dA$,而$[A,F_A]=A\wedge(dA+A\wedge A)-(dA+A\wedge A)\wedge A=-dF_A$,从而该断言成立。有趣的是,另一组方程,即电磁场里的麦克斯韦方程(Maxwell Equation)与此密切相关。回忆麦克斯韦方程是$$\left\{\begin{array}{clc}\nabla \cdot \vec{B}& =0 &\mbox{自由磁极不存在}\\ \nabla\times\vec{E}+\frac{\partial \vec{B}}{\partial t} & =0 &\mbox{法拉第方程}\\ \nabla\cdot \vec{E}&=4\pi\rho &\mbox{麦克斯韦-库仑方程}\\ \nabla\times\vec{B}-\frac{\partial \vec{E}}{\partial t}&=4\pi \vec{j}&\mbox{安培定律}\end{array}\right.$$这里我们考虑的是三维的情况,$\vec{E}=(E_1,E_2,E_3)$是电场,$\vec{B}=(B_1,B_2,B_3)$是磁场,而$\rho$是电荷密度,$\vec{j}=(j_1,j_2,j_3)$是电流密度,$\nabla$是梯度算子。Hermann Weyl指出,上述Maxwell方程组可以看成$\R^{1,3}$的Minkowski空间平凡主丛$\R^{1,3}\times U(1)$上的Yang-Mills方程!
首先从前两个方程$\nabla\cdot \vec{B}=0$以及$\nabla\times \vec{E}+\frac{\partial \vec{B}}{\partial t}=0$和$\R^3$中的高斯公式,我们知道存在三维的向量函数$\vec{A}(t,x),x=(x^1,x^2,x^3)$以及数量函数$\Phi(t,x)$使得$\vec{B}=\nabla\times\vec{A}$,$\vec{E}=\nabla\Phi-\frac{\partial \vec{A}}{\partial t}$。从而引入四维向量$\tilde{A}=(\Phi,A)$,以及电磁密度$\tilde{j}=4\pi(-\rho,\vec{j})$。如果把$\tilde{A}$看成$\R^{1,3}$的平凡主丛上的联络,即$\tilde{A}(t,x)=\Phi dt+A_1 dx^1+A_2 dx^2+A_3 dx^3$在相差一个$i$系数下,它可以看成主丛$U(1)$上的联络(注意$U(1)$上联络取值为$\mathfrak{u}(1)$,也即纯虚数)。我们有$$F_{\tilde{A}}=d\tilde{A}+\tilde{A}\wedge\tilde{A}=(\partial_\alpha A_\beta-\partial_\beta A_\alpha)dx^\alpha dx^\beta$$这里$A=A_\alpha dx^\alpha,F=F_{\alpha\beta} dx^\alpha dx^\beta$。带入先前条件知道$$F=\begin{bmatrix}0 & -E_1 & -E_2 & -E_3 \\ E_1 & 0 & B_3 & -B_2 \\ E_2 & -B_3 & 0 & B_1 \\ E_3 & B_2 & -B_1 & 0\end{bmatrix}$$事实上,我们有如下定理
定理 Maxwell的前两个方程即为$d F_A=0$。
我们知道$\partial_1 F_{23}+\partial_2 F_{31}+\partial_3 F_{12}=0$也就是$dx^1 dx^2 dx^3$这一项,我们得到$\nabla \cdot B=0$。同理对于其他项,我们分别得到第二个方程的三个分量分别为$0$。
而对于第三,第四个方程,我们考虑$\R^{1,3}$上的Hodge$*$算子,也就是有如下的对比,令$\epsilon_1=-1$
$\R^{1,3}$ | $\R^4$ |
$*(\epsilon_1 dx^0\wedge dx^1)=dx^2\wedge dx^3$ | $*( dx^0\wedge dx^1)=dx^2\wedge dx^3$ |
$*(\epsilon_1 dx^0\wedge dx^2)=dx^3\wedge dx^1$ | $*( dx^0\wedge dx^2)=dx^3\wedge dx^1$ |
$*(\epsilon_1 dx^0\wedge dx^3)=dx^1\wedge dx^2$ | $*( dx^0\wedge dx^3)=dx^1\wedge dx^2$ |
$*(dx^2\wedge dx^3)=dx^0\wedge dx^1$ | $*(dx^2\wedge dx^3)=dx^0\wedge dx^1$ |
$*^2=**=-1$ | $*^2=**=1$ |
于是我们有如下定理
定理 Maxwell后两个方程即为$d*F_A=\tilde{j}$
综合起来,也就是说平凡主丛$\R^{1,3}\times U(1)$上的Yang-Mills方程即为电磁密度为$0$的Maxwell方程。