狭义相对论
以牛顿第二定律为基础的动力学一直被认为是描述动力学的基本方式。牛顿第二定律默认了质量是一个不依赖于运动状态的恒量,人们发现这实际上是不对的。物体的质量随着速度的增大而增大,精确地:\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)。这就是经过爱因斯坦修正以后的公式。这就是全部的相对论了。我们想知道的是,为什么会这样,以及这样会与我们原来熟知的力学有什么不同。
洛伦兹变换
牛顿力学体系的一个重要结论就是相对性原理:仅仅通过观察飞船内的现象不足以推断飞船是静止还是在匀速运动(加速是能被感知的)。我们可以直接验证这件事:在某个坐标系\(S\)中的一个“事件”可以用坐标和时间\((x,y,z,t)\)四个维度来描述。那么对于一个相对于\(S\)以\(u\)的速度沿\(x\)正方向运动的坐标系\(S'\),同样的时间对应的维度就变换为\((x',y',z',t')\),根据生活经验,很容易得到:
这称为“伽利略坐标变换”。把变换后的坐标代入到牛顿定律的公式中,我们发现一切依然吻合(加速度作为坐标的二阶导数与变换前是完全相同的)。
也就是说仅凭力学试验无法推测系统是否在运动,因为力学定律遵循伽利略变换的相对性原理。但是电学定律——麦克斯韦方程组——不遵循伽利略变换。所以运动飞船中的光电现象应当与静止飞船中的光电现象有所不同。这是由于麦克斯韦方程组的一个结论是光速相对于任何观察者始终为恒定大小\(c\)。当我们以速度\(u\)前进时,假设从后方射来一束光,我们根据伽利略变换将会得到光速相对我们为\(c-u\)。但令人惊奇的是,事实证明光速相对于我们依然为\(c\)!我们通过电学实验依然无法推测系统是否在运动!相对性原理依然成立!当时很多人怀疑是麦克斯韦方程组出错了,而实验证明错的不是麦克斯韦方程组,而是伽利略坐标变换本身。
为此,爱因斯坦提出了相对论。相对论的两个基本假设是:相对性原理始终成立,光速相对任何观察者都为\(c\)。相对性原理是实验的结果,光速恒定是麦克斯韦方程组的结果,也是实验的结果。现在我们需要一种新的坐标变换方式,来使得这两个假设始终成立。我们考虑一个最简单的事件:在参考系\(S\)中,0时刻沿\(x\)正方向发出一束光,在\(t\)时刻到达位置\(x\),称为事件\((x,t)\)。显然\(x=ct\)。有另一个参考系\(S'\),0时刻与\(S\)重合,并相对于\(S\)以速度\(u\)沿\(x\)正方向运动。根据相对性原理的假设,在\(S'\)中,我们也观察到一束光从0时刻出发。根据光速不变的假设,这束光的速度也为\(c\)。因此这个坐标系下的事件\((x',t')\)也满足\(x'=ct'\)。现在我们要找出\((x,t)\)与\((x',t')\)之间的变换关系。这个问题之所以是关键的,是因为此时我们无法默认两事件的同时性了,我们没有理由说明\(t=t'\),而更可能的是\(t \neq t'\)。我们先尝试考虑某个线性的变换,这样的猜测总是没有害处的。我们猜测这种变换只涉及某个系数,即\(x'=\gamma(x-ut)\)。由于逆变换也要成立,所以\(x=\gamma(x'+ut')\)。代入\(x=ct\)与\(x'=ct'\)消去\(x\),得到\(ct'=\gamma(ct-ut)\),\(ct=\gamma(ct'+ut')\)。解得\(\gamma=\dfrac{1}{\sqrt{1-u^2/c^2}}\)。也就是得到了这样一个变换:
这称为洛伦兹变换。我们发现用它代入时,麦克斯韦方程组始终成立。也就是说,应当做出改变的不是电动力学定律而是力学定律,我们需要给牛顿力学的方程做一些调整,使得它能够在洛伦兹变换下保持不变。结果发现,唯一的要求就是在开头提到的给质量乘上一个关于速度的修正因子。我们要做的,就是试图在逻辑上以及实验上理解这种看上去奇特的新的变换。这种“理解”将涉及到我们关于“时间”和“空间”的“观念”。
时间与空间
当人们发现光电现象破坏了伽利略变换时,人们猜测它是否也破坏了相对性原理。我们能否通过光电现象在系统内部测出系统运动的绝对速度?迈克尔逊与莫雷设计了实验,让一个光源同时沿两个互相垂直的方向发出并经过相同的距离反射回来。不停转动这个装置,假设装置有着某个方向的绝对速度\(u\),那么当某一方向与这个速度重合时,我们可以计算光线折返的总时间:相对于地面的观察者来说光速始终为\(c\),那么去的过程中有\(ct_1=L+ut_1\),回的过程中\(ct_2=L-ut_2\),解得\(t_1+t_2=\dfrac{L}{c-u}+\dfrac{L}{c+u}=\dfrac{2cL}{c^2-u^2}=\dfrac{2L/c}{1-u^2/c^2}\)。此时装置沿着垂直方向没有速度,这个方向上去的时候\(ct_1=\sqrt{L^2+(ut_1)^2}\),回的时候\(ct_2=\sqrt{L^2+(ut_2)^2}\),得到\(t_1+t_2=\dfrac{2L}{\sqrt{c^2-u^2}}=\dfrac{2L/c}{\sqrt{1-u^2/c^2}}\)。可见只要存在绝对速度\(u\),这两个时间就不同,两束光反射后将汇聚形成干涉。然而实验结果表明并不存在干涉,两个时间始终相同。我们利用光电现象也没能测出绝对速度!人们认识到,绝对速度是不存在的,不能测出绝对速度本身就是自然界的一条法则——一切运动都是相对某个参照物的运动。
自然界是如何在保持光速恒定的前提下保证绝对速度无法被测出的?我们根据洛伦兹变换发现了时空收缩的性质:
当一个物体相对于某个参照系运动时,从参照系看来这个物体在运动方向上会发生长度的收缩。这是“动尺缩短”效应。事实上,这个收缩正是乘上因子\(\sqrt{1-u^2/c^2}\),把它代入到迈克尔逊-莫雷实验中运动方向的长度\(L\)上,恰好能使得两个方向光的运动时间完全相等。这正是对洛伦兹变换在\(x\)方向上的形式的一种解释。
当一个物体相对于某个参照系运动时,并且假设这个物体上有某个时钟与它一起运动,从参照系看来这个物体上的时钟走得更慢。这是“时间膨胀”效应。当飞船上的人感觉自己在正常生活时,地面上的人看他就好像慢动作一样。地面上的时钟走过一秒时,飞船上的时钟还没走完一秒。这是对洛伦兹变换的第四个方程的一种解释。
这两个效应是违反直觉的,因为它们只有当我们在接近光速运动时才会表现出来。动尺的缩短和时间的膨胀都可以理解为洛伦兹变换预言的结论,它们涉及到我们对时间和空间的理解。所谓长度,它是相对于某个参考系的量,在这个参考系下的某个时刻读出两个事件的坐标并将坐标相减,称为这个物体在这个参考系下这一时刻的长度。因此,由于物体在变换到另一个与它有相对速度的参考系下时会乘上一个因子,经过计算得到的结果恰好是“缩短”。所谓时间,它是人们想象出来的一个匀速流逝的量,在相对论里最容易地理解时间的方法就是看“光走了多远”,一秒钟的含义是“光走过了\(c\)米的这段时间”。一切钟都可以理解为一个“光钟”,在同一参考系下相对性原理保证了所有奇形怪状的钟都是走得一样快的。光钟是用光的来回反射来计时的钟,用光走过的路程来度量时间。一个原本上下反射的光钟由于在另一参考系下光路变得倾斜而需要通过更多路程来完成“一秒”,因此在那个参考系下认为光钟走得慢了。
由于时间的变换,“同时性”也变成相对的了。在\(S\)系下观察到某两个事件同时发生,在\(S'\)系下这两个事件未必同时发生,因为时间的变换是并不是\(t\)本身的变换,它会牵扯到\(x\)的变换。例如在运动的火车中间同时像前后发出两束光,在车上的人一定会观察到两束光同时击中墙壁。然而在地面观察者看来,向前发出的光一定会较晚到达,向后发出的光一定会较早到达。
运动物体时间变慢的现象产生了一个佯谬:两个同龄人中的一个去宇宙航行一圈以后回来会变得比另一个人年轻,因为相对于地面上的人来说他在高速运行因而相对的时间减慢。但宇航员能不能说以他为参考系是他的兄弟相对他在高速运动因此应该是他兄弟更年轻呢?两兄弟看似是对称的,但仔细思考发现,去航行的人从出发到回归一定经历过加速和减速,也就是他受到了力,而地面上的人却没有感受到任何力。狭义相对论没有对非惯性系的情况给出解释。孪生子佯谬的孪生子实际上是不对称的。我们应当说,受到力的那个人是年轻的那个。
速度的变换
由于速度不能超过光速,我们已经知道向伽利略变换那样简单地把速度叠加是不正确的。而由于速度可以直接用空间和时间计算得到,我们只需要依据洛伦兹变换进行简单的计算就行了。假设\(S\)系中有物体从原点开始以速度\(v\)向\(x\)正方向运动,经过时间\(t\)后到达\((vt,t)\)。设0时刻\(S'\)与\(S\)重合,此后\(S'\)相对\(S\)向\(x\)负方向运动。用洛伦兹变换把\((vt,t)\)变换到\(S'\)中得到\(\left(\dfrac{vt+ut}{\sqrt{1-u^2/c^2}},\dfrac{t+uvt/c^2}{\sqrt{1-u^2/c^2}}\right)\),因此\(v'=\dfrac{x'}{t'}=\dfrac{u+v}{1+uv/c^2}\)。
这就是相对论中的速度叠加原理。在\(u\)和\(v\)很小时,\(uv/c^2\)可以忽略,退化为伽利略的速度叠加原理。而比如\(u,v\)都等于\(1/2c\)时,计算得到叠加后速度为\(\dfrac{4}{5}c\)。当\(u\)为\(c\)时,\(\dfrac{c+v}{1+v/c}=c\)。
用同样方法我们也可以计算垂直于参考系运动方向的速度的变换。只不过此时\(y'=y\),只有时间做了变换,由此得到\(v'=v\sqrt{1-u^2/c^2}\)。这恰好与我们之前看到的运动的光钟中光束斜着进行时的比例系数吻合。
相对论性质量
我们假设动量守恒和能量守恒是始终成立的。下面我们试图从物理定律必须在每个坐标系中都相同这个相对性原理来论证物体质量一定满足\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)。
为了避免研究力的变换定律,我们研究碰撞这个问题。我们把动量定义为质量乘以速度矢量。假设两个完全相同的粒子以相同的速度大小发生碰撞。由于碰撞前动量总和为0,因此碰撞后动量总和依然为0。我们假设碰撞前后粒子的运动方向偏转了一个角度,我们把参考系\(S\)取在\(y\)轴与对称轴重合的位置。由于对称性,碰撞后两粒子的速度大小也是相等的(没有理由不相等)。现在我们取另一个参考系\(S'\),\(S'\)相对于\(S\)以与粒子1的水平速度相等的速度运动,所以在\(S'\)下粒子1是垂直向上运动再反弹的,而粒子2的水平速度加快,其碰撞张角变得更大了。在\(S'\)下,竖直方向的动量依然守恒,因此设粒子1在\(S'\)下的垂直速度为\(w\),粒子2在\(S'\)下的水平速度为\(u\),速度为\(v\),粒子2在\(S'\)下与水平方向夹角为\(\alpha\),那么得到\(m_ww=m_vu\tan \alpha\)。我们再取一个参考系\(S''\),这个参考系相对于\(S'\)以\(u\)的速度向左运动,于是粒子2变成竖直运动了。根据对称性这不过是\(S'\)中情况的颠倒,因此\(S''\)中粒子2的速度就是\(w\)。用洛伦兹的速度变换把它变换到\(S'\)中,得到\(S'\)中粒子2的竖直速度为\(w\sqrt{1-u^2/c^2}\)。因此\(u\tan \alpha=w\sqrt{1-u^2/c^2}\)。代入动量守恒的式子得到\(m_ww=m_vw\sqrt{1-u^2/c^2}\)。也即\(\dfrac{m_w}{m_v}=\sqrt{1-u^2/c^2}\)。现在令\(w \to 0\),那么\(m_w \to m_0\),由于竖直方向速度很小,因此\(\alpha \to 0\),\(u,v\)趋向同一个值,因此\(m_v \to m_u\)。因此\(\dfrac{m_0}{m_u} \to \sqrt{1-u^2/c^2}\),也就得到了最终的\(m_u=\dfrac{m_0}{\sqrt{1-u^2/c^2}}\)。
\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)恰好保证了物体的运动速度不能超过光速。受恒力的物体在牛顿力学下会不断加速直到速度无穷大,但在相对论动力学下外力做功增加的不是物体的速度而是动量,动量的增大在速度接近光速时只表现为质量的增大,而此时速度的增加量趋向0。
相对论性能量
现在我们通过一个非弹性碰撞的粒子来研究能量。假设两个相同粒子以速度\(w\)相撞然后粘在一起静止。在一个垂直速度\(w\)的以微小速度\(u\)运动的参考系下观察这次碰撞,碰撞前垂直方向总动量约为\(2m_w u\)(由于\(u\)无穷小,其质量近似于原参考系中的\(m_w\)),碰撞后垂直方向总动量为\(Mu\)。因此\(2m_w=M\)。而\(M\)也近似为两粒子碰撞后在静止参考系中的总质量。可见碰撞后的总质量\(M=2m_w>2m_0\)——为了使两物体碰撞时动量守恒成立即使在碰撞后形成的物体处于静止状态其质量也必须大于物体静止的质量之和。
两粒子的质量碰撞前之所以是\(m_w\)是由于运动,这个动能以“质量增加”的方式表现出来。在碰撞后发生能量损失,能量又以质量的方式附加在了物体上。这意味着能量具有惯性。爱因斯坦观察到如果用\(mc^2\)来表示总能量时运算会得到简化。当我们把\(\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)写作\(m_0\left(1-\dfrac{v^2}{c^2}\right)^{-\frac{1}{2}}\)并用广义二项式定理展开得到\(m_0\left(1+\dfrac{1}{2}v^2/c^2+\dfrac{3}{8}v^4/c^4+\cdots\right)\)时,我们在\(v\)比较小时舍去四次以上的项得到\(m \approx m_0+\dfrac{1}{2}m_0v^2/c^2\),因此\(\Delta m \approx \dfrac{\Delta E_k}{c^2}\)。所以如果等式两边同时乘以\(c^2\),得到\(mc^2=m_0c^2+\dfrac{1}{2}m_0v^2+\cdots\)。第二项恰好是物体的动能,而第一项可以理解为某种“静能”。所以如果我们姑且假设物体的总能量始终为\(E=mc^2\),我们会发现这样的假设正好会得出\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)的结论——
根据能量的定义,\(\dfrac{dE}{dt}=F \cdot v\)。根据动量的定义,\(F=\dfrac{d(mv)}{dt}\)。于是得微分方程\(\dfrac{dE}{dt}=v \cdot \dfrac{d(mv)}{dt}\)。代入\(E=mc^2\),得到\(c^2\dfrac{dm}{dt}=v\dfrac{d(mv)}{dt}\)。两边同时乘以\(2m\),得\(c^2 \cdot 2m\dfrac{dm}{dt}=2mv\dfrac{d(mv)}{dt}\),根据微分的运算法则\(c^2\dfrac{d(m^2)}{dt}=\dfrac{d(m^2v^2)}{dt}\),两边同时积分得\(c^2m^2=m^2v^2+C\),当\(v=0\)时\(c^2m_0^2=C\),因此\(c^2m^2=m^2v^2+c^2m_0^2\)。因此解得\(m=\dfrac{m_0c}{\sqrt{c^2-v^2}}=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)。
可见,在相对论下“质量”和“能量”是相当的,实验已经证明了这一点。在原子弹爆炸时,正是微小的质量亏损释放出了巨大的能量。
最后我们发现,速度\(v\)、动量\(p\)、总能量\(E\)能以一个相当简单的方式联系起来。对\(m=\dfrac{m_0}{\sqrt{1-v^2/c^2}}\)两边同时平方得到\(m^2(1-v^2/c^2)=m_0^2\),于是\(m^2c^4-m^2v^2c^2=m_0^2c^4\),得到了\(E^2-p^2c^2=m_0^2c^4\)。还有一个关系也很常用,在\(E=mc^2\)两边同时乘以\(v\)得到\(Ev=pc^2\)。
对光子来说,根据量子力学\(E=h\nu,p=h/\lambda\),得到\(E=pc\),代入解得\(m_0=0\),既光子的静止质量为0。但我们不能代入\(E=\dfrac{m_0c^2}{\sqrt{1-v^2/c^2}}\)说光子的能量也为0,因为光子的速度始终为\(c\),这是个0/0的未定式。事实上光子实际上具有能量,这个能量正是它永远以光速运动才具有的能量。
时空
我们已经在使用\((x,y,z,t)\)这样一个四维空间里的坐标来表示一个事件了。如果把洛伦兹变换看作一个作用在这样一个矢量上的变换,它具有什么样的含义?我们发现洛伦兹变换的数学形式和矢量的转动是很相似的。平面上的矢量\((x,y)\)在平面上转过\(\theta\)角时做坐标变换\(x'=x\cos\theta+y\sin\theta,y'=y\cos\theta-x\sin\theta\)。对于洛伦兹变换中的\(x\)和\(t\),假如我们在\(t\)上附加一个光速的因子,它的形式就变得和转动相同。对于转动,“模长”\(x^2+y^2\)是保持恒定的,类似地我们可以验证在洛伦兹变换下,矢量\((x,y,z,t)\)始终保持\(x^2+y^2+z^2-c^2t^2\)恒定。
于是我们试图把矢量的观念进行扩展,使其包含时间的分量。这样的四维矢量在“时空”这样一个四维的向量空间中。如何理解这样一个四维空间呢?我们可以这样类比:当我们观察一个三维空间中的立方体时,假设我们始终正对着立方体的一个面并观察者只能前后移动,那么我们的移动只会导致我们观察到立方体宽度的变化,我们无法观察到立方体深度的变化。但假设此时我们可以在三维空间中的任何位置观察,这时我们不仅有立方体的宽度还会观察到立方体有深度。当我们的观察点转过一个角度时,立方体的宽度和深度同时变化。我们用同样的方式来看待洛伦兹变换,它是空间与时间的混合。由于日常经验不足以让我们接触到高速,因此我们平常的观察视角都局限于空间这三个维度上。现在当我们的观察视角掺入了时间的维度后,观察点(参考系)的变化将会同时引发空间和时间的变换。我们认为占有空间并延续了某一时间间隔的物体在新的世界里占有了“一个小块”,这个新的世界就是“时空”,我们对这个小块的观察在各个维度上随着观察位置的变化而变化。
然而,由于在洛伦兹变化下保持恒定的不是\(x^2+y^2+z^2+t^2\)而是\(x^2+y^2+z^2-c^2t^2\),我们肯定无法用通常意义下的欧氏几何来想象“时空”。但不难预料“时空的几何学”应当是与欧氏几何类似的。我们把\(x^2+y^2+z^2-c^2t^2\)这个量看作是三维空间中的距离一样的“实在”,把它称为两个时空点之间的间隔(的平方)。“实在”指的就是不随观测点的改变而变化的量。
在三维空间中,我们很容易接受三个方向的“空间”是等价的。在四维的时空中,我们也希望看到四个维度是等价的。但我们在经验中却用不同的单位来衡量空间(米)和时间(秒),这就好像在三维空间中用“米”来衡量\(x,y\)方向的空间却用“英尺”来衡量\(z\)方向的空间一样。现在我们希望把时间的单位和空间的单位统一起来,我们利用的就是\(x^2\)、\(y^2\)、\(z^2\)、\(c^2t^2\)这四项的等价性,这四项的单位应当是一样的。因此应当有\(\text{m}^2=c^2\text{s}^2\)。即\(1\text{ m}=c\text{ s}\)。如果时间和空间都同一用“米”的单位来表示,那么洛伦兹变换可以写成更简单的形式。原本的\(x'=\dfrac{x-ut}{\sqrt{1-u^2/c^2}}\)中的\(t\)的单位是秒,现在一秒等于\(1/c\)米,因此\(t \text{ s}\)要用\(t/c \text{ m}\)来代换。同样速度\(u\)的单位是\(\text{m/s}\),现在要代换成\(c\)。因此得到的结果是\(x'=\dfrac{x-ut}{\sqrt{1-u^2}}\)。时间也是同理,最终我们得到同一单位下的洛伦兹变换
当我们用模长来类比时空间隔时,我们把\(x^2+y^2+z^2-c^2t^2\)类比为了间隔的平方。但这个表达式不具有平方和的非负性,因为出现了负号。因此时空间隔可能是虚数。当时空间隔为实数时,我们称它为“类空间隔”,因为它更像空间的间隔;而当它为虚数时,我们称它为“类时间隔”。在时空中存在这样一些点形成的曲面,它们与原点的间隔始终为0,在这个曲面的两侧的点分别与原点的间隔为实数和虚数。这个曲面称为“光锥”。我们容易理解,光锥上的点(事件)恰好是那些零时刻从原点出发的光在任意时刻产生的事件。更一般的,从某一点出发的光到达的点之间的间隔始终为0。“光速在任意坐标系下都相同”现在可以表达为“在某坐标系下间隔为0的两点在任意坐标系下间隔都为0”。
我们把光锥想象成一个四维空间里的“圆锥”。光锥之内负的时间轴的那半部分与原点的间隔是类空间隔,这些事件可以影响到原点(“此刻”),因为以某个恰当的小于\(c\)的速度出发它能够到达原点,这部分区域称为“可感知的过去”;光锥之内正的时间轴的那半部分与原点的间隔也是类空间隔,原点可以影响到这部分区域,称为“有影响的未来”。而光锥之外的部分与原点的间隔为类时间隔,它既不能影响到原点,我们也不能以原点来影响它。例如太阳的爆炸只能影响到八分钟以后的地球,在那之前地球处于太阳的光锥之外,不可能受到太阳的影响。事实上,当我们说“此刻”时,这只是一个基于人们日常经验的未定义的概念。我们看到的太阳是八分钟以前的太阳,“此刻”的太阳如果指的是地球参考系下与地球上某个事件同时的太阳的话,那这只是头脑中的一种想象,因为它永远无法被观测到,因此在物理上是不可定义的。并且,“此刻”取决于参考系的选取,因为同时性是相对的,如果太阳相对于地球在运动,那么即便在地球上人想象的此刻的太阳上的人看来的此刻的地球也不是地球上人认为的此刻的地球。
四维矢量
我们通过洛伦兹变换与空间转动的类比猜测存在这样的四维矢量\((x,y,z,t)\),这个矢量本身是比其各个分量更实在的东西,就好像速度本身是比速度的三个分量更实在的东西,因为它不会因为坐标系的变换而改变。事实上,不仅是有空间距离和时间间隔构成的矢量\((x,y,z,t)\)满足这样的性质,我们将会看到由动量的三个分量和能量组成的四维矢量\((p_x,p_y,p_z,E)\)也满足这样的性质!
为了运算的简便,我们在此修改各个物理量的单位使得它们在时空上得到统一。例如能量和质量,根据\(E=mc^2\)质量和能量只相差光速的因子,所以可以统一为同一个单位,我们直接认为能量就是质量。于是写出\(E=m=\dfrac{m_0}{\sqrt{1-v^2}}\),\(p=mv=Ev=\dfrac{m_0v}{\sqrt{1-v^2}}\)。此时\(E^2-p^2=m_0^2\)。
现在当我们把某个具有速度\(v\)的物体的运动变换到另一个相对这个参考系有\(x\)方向速度\(u\)的新坐标系下时,根据速度的变换公式有\(v'=\dfrac{v-u}{1-uv}\)。因此\(E'=\dfrac{m_0}{\sqrt{1-v'^2}}=\dfrac{(m_0/\sqrt{1-v^2})-(m_0v/\sqrt{1-v^2})u}{\sqrt{1-u^2}}=\dfrac{E-up}{\sqrt{1-u^2}}\)。而\(p'=E'v'=\dfrac{m_0v-m_0u}{\sqrt{1-u^2}\sqrt{1-v^2}}=\dfrac{p-uE}{\sqrt{1-u^2}}\)。这恰好与洛伦兹变换的形式相同,也就是我们用四维矢量\((p_x,p_y,p_z,E)\)的洛伦兹变换
也就是我们发现了一个比动量和能量都更“实在”的矢量,它的空间分量是动量,时间分量是能量。我们依然把这个矢量称为动量,它的时间分量就是能量。当我们把动量守恒推广到相对论中时,它不仅代表了三维空间意义下的动量守恒,还包含了能量守恒。
由于四维矢量的长度现在必须定义为\(x^2+y^2+z^2-t^2\)(省略了光速因子),而长度是矢量与自身的点积,因此我们把四维矢量的点积定义为\(\sum\limits_{\mu}'A_\mu A_\mu=A_x^2+A_y^2+A_z^2-A_t^2\)。因此,四维动量矢量\((p_x,p_y,p_z,E)\)的长度平方就是\(p^2-E^2\)。我们导出过\(E^2-p^2=m_0^2\),所以它的长度其实表示的就是物体的静质量。
在这里,我们清楚地看到了时间和空间的统一性。正如闵可夫斯基所说:“空间本身和时间本身将消失在完全的阴影之中,只有它们之间的某种结合才将得以生存。”