狭义相对论

以牛顿第二定律为基础的动力学一直被认为是描述动力学的基本方式。牛顿第二定律默认了质量是一个不依赖于运动状态的恒量,人们发现这实际上是不对的。物体的质量随着速度的增大而增大,精确地:m=m01v2/c2。这就是经过爱因斯坦修正以后的公式。这就是全部的相对论了。我们想知道的是,为什么会这样,以及这样会与我们原来熟知的力学有什么不同。

洛伦兹变换

牛顿力学体系的一个重要结论就是相对性原理:仅仅通过观察飞船内的现象不足以推断飞船是静止还是在匀速运动(加速是能被感知的)。我们可以直接验证这件事:在某个坐标系S中的一个“事件”可以用坐标和时间(x,y,z,t)四个维度来描述。那么对于一个相对于Su的速度沿x正方向运动的坐标系S,同样的时间对应的维度就变换为(x,y,z,t),根据生活经验,很容易得到:

x=xuty=yz=zt=t

这称为“伽利略坐标变换”。把变换后的坐标代入到牛顿定律的公式中,我们发现一切依然吻合(加速度作为坐标的二阶导数与变换前是完全相同的)。

也就是说仅凭力学试验无法推测系统是否在运动,因为力学定律遵循伽利略变换的相对性原理。但是电学定律——麦克斯韦方程组——不遵循伽利略变换。所以运动飞船中的光电现象应当与静止飞船中的光电现象有所不同。这是由于麦克斯韦方程组的一个结论是光速相对于任何观察者始终为恒定大小c。当我们以速度u前进时,假设从后方射来一束光,我们根据伽利略变换将会得到光速相对我们为cu。但令人惊奇的是,事实证明光速相对于我们依然为c!我们通过电学实验依然无法推测系统是否在运动!相对性原理依然成立!当时很多人怀疑是麦克斯韦方程组出错了,而实验证明错的不是麦克斯韦方程组,而是伽利略坐标变换本身。

为此,爱因斯坦提出了相对论。相对论的两个基本假设是:相对性原理始终成立,光速相对任何观察者都为c相对性原理是实验的结果,光速恒定是麦克斯韦方程组的结果,也是实验的结果。现在我们需要一种新的坐标变换方式,来使得这两个假设始终成立。我们考虑一个最简单的事件:在参考系S中,0时刻沿x正方向发出一束光,在t时刻到达位置x,称为事件(x,t)。显然x=ct。有另一个参考系S,0时刻与S重合,并相对于S以速度u沿x正方向运动。根据相对性原理的假设,在S中,我们也观察到一束光从0时刻出发。根据光速不变的假设,这束光的速度也为c。因此这个坐标系下的事件(x,t)也满足x=ct。现在我们要找出(x,t)(x,t)之间的变换关系。这个问题之所以是关键的,是因为此时我们无法默认两事件的同时性了,我们没有理由说明t=t,而更可能的是tt。我们先尝试考虑某个线性的变换,这样的猜测总是没有害处的。我们猜测这种变换只涉及某个系数,即x=γ(xut)。由于逆变换也要成立,所以x=γ(x+ut)。代入x=ctx=ct消去x,得到ct=γ(ctut)ct=γ(ct+ut)。解得γ=11u2/c2。也就是得到了这样一个变换:

x=xut1u2/c2y=yz=zt=tux/c21u2/c2

这称为洛伦兹变换。我们发现用它代入时,麦克斯韦方程组始终成立。也就是说,应当做出改变的不是电动力学定律而是力学定律,我们需要给牛顿力学的方程做一些调整,使得它能够在洛伦兹变换下保持不变。结果发现,唯一的要求就是在开头提到的给质量乘上一个关于速度的修正因子。我们要做的,就是试图在逻辑上以及实验上理解这种看上去奇特的新的变换。这种“理解”将涉及到我们关于“时间”和“空间”的“观念”。

时间与空间

当人们发现光电现象破坏了伽利略变换时,人们猜测它是否也破坏了相对性原理。我们能否通过光电现象在系统内部测出系统运动的绝对速度?迈克尔逊与莫雷设计了实验,让一个光源同时沿两个互相垂直的方向发出并经过相同的距离反射回来。不停转动这个装置,假设装置有着某个方向的绝对速度u,那么当某一方向与这个速度重合时,我们可以计算光线折返的总时间:相对于地面的观察者来说光速始终为c,那么去的过程中有ct1=L+ut1,回的过程中ct2=Lut2,解得t1+t2=Lcu+Lc+u=2cLc2u2=2L/c1u2/c2。此时装置沿着垂直方向没有速度,这个方向上去的时候ct1=L2+(ut1)2,回的时候ct2=L2+(ut2)2,得到t1+t2=2Lc2u2=2L/c1u2/c2。可见只要存在绝对速度u,这两个时间就不同,两束光反射后将汇聚形成干涉。然而实验结果表明并不存在干涉,两个时间始终相同。我们利用光电现象也没能测出绝对速度!人们认识到,绝对速度是不存在的,不能测出绝对速度本身就是自然界的一条法则——一切运动都是相对某个参照物的运动。

自然界是如何在保持光速恒定的前提下保证绝对速度无法被测出的?我们根据洛伦兹变换发现了时空收缩的性质:

当一个物体相对于某个参照系运动时,从参照系看来这个物体在运动方向上会发生长度的收缩。这是“动尺缩短”效应。事实上,这个收缩正是乘上因子1u2/c2,把它代入到迈克尔逊-莫雷实验中运动方向的长度L上,恰好能使得两个方向光的运动时间完全相等。这正是对洛伦兹变换在x方向上的形式的一种解释。

当一个物体相对于某个参照系运动时,并且假设这个物体上有某个时钟与它一起运动,从参照系看来这个物体上的时钟走得更慢。这是“时间膨胀”效应。当飞船上的人感觉自己在正常生活时,地面上的人看他就好像慢动作一样。地面上的时钟走过一秒时,飞船上的时钟还没走完一秒。这是对洛伦兹变换的第四个方程的一种解释。

这两个效应是违反直觉的,因为它们只有当我们在接近光速运动时才会表现出来。动尺的缩短和时间的膨胀都可以理解为洛伦兹变换预言的结论,它们涉及到我们对时间和空间的理解。所谓长度,它是相对于某个参考系的量,在这个参考系下的某个时刻读出两个事件的坐标并将坐标相减,称为这个物体在这个参考系下这一时刻的长度。因此,由于物体在变换到另一个与它有相对速度的参考系下时会乘上一个因子,经过计算得到的结果恰好是“缩短”。所谓时间,它是人们想象出来的一个匀速流逝的量,在相对论里最容易地理解时间的方法就是看“光走了多远”,一秒钟的含义是“光走过了c米的这段时间”。一切钟都可以理解为一个“光钟”,在同一参考系下相对性原理保证了所有奇形怪状的钟都是走得一样快的。光钟是用光的来回反射来计时的钟,用光走过的路程来度量时间。一个原本上下反射的光钟由于在另一参考系下光路变得倾斜而需要通过更多路程来完成“一秒”,因此在那个参考系下认为光钟走得慢了。

由于时间的变换,“同时性”也变成相对的了。在S系下观察到某两个事件同时发生,在S系下这两个事件未必同时发生,因为时间的变换是并不是t本身的变换,它会牵扯到x的变换。例如在运动的火车中间同时像前后发出两束光,在车上的人一定会观察到两束光同时击中墙壁。然而在地面观察者看来,向前发出的光一定会较晚到达,向后发出的光一定会较早到达。

运动物体时间变慢的现象产生了一个佯谬:两个同龄人中的一个去宇宙航行一圈以后回来会变得比另一个人年轻,因为相对于地面上的人来说他在高速运行因而相对的时间减慢。但宇航员能不能说以他为参考系是他的兄弟相对他在高速运动因此应该是他兄弟更年轻呢?两兄弟看似是对称的,但仔细思考发现,去航行的人从出发到回归一定经历过加速和减速,也就是他受到了力,而地面上的人却没有感受到任何力。狭义相对论没有对非惯性系的情况给出解释。孪生子佯谬的孪生子实际上是不对称的。我们应当说,受到力的那个人是年轻的那个。

速度的变换

由于速度不能超过光速,我们已经知道向伽利略变换那样简单地把速度叠加是不正确的。而由于速度可以直接用空间和时间计算得到,我们只需要依据洛伦兹变换进行简单的计算就行了。假设S系中有物体从原点开始以速度vx正方向运动,经过时间t后到达(vt,t)。设0时刻SS重合,此后S相对Sx负方向运动。用洛伦兹变换把(vt,t)变换到S中得到(vt+ut1u2/c2,t+uvt/c21u2/c2),因此v=xt=u+v1+uv/c2

这就是相对论中的速度叠加原理。在uv很小时,uv/c2可以忽略,退化为伽利略的速度叠加原理。而比如u,v都等于1/2c时,计算得到叠加后速度为45c。当uc时,c+v1+v/c=c

用同样方法我们也可以计算垂直于参考系运动方向的速度的变换。只不过此时y=y,只有时间做了变换,由此得到v=v1u2/c2。这恰好与我们之前看到的运动的光钟中光束斜着进行时的比例系数吻合。

相对论性质量

我们假设动量守恒和能量守恒是始终成立的。下面我们试图从物理定律必须在每个坐标系中都相同这个相对性原理来论证物体质量一定满足m=m01v2/c2

为了避免研究力的变换定律,我们研究碰撞这个问题。我们把动量定义为质量乘以速度矢量。假设两个完全相同的粒子以相同的速度大小发生碰撞。由于碰撞前动量总和为0,因此碰撞后动量总和依然为0。我们假设碰撞前后粒子的运动方向偏转了一个角度,我们把参考系S取在y轴与对称轴重合的位置。由于对称性,碰撞后两粒子的速度大小也是相等的(没有理由不相等)。现在我们取另一个参考系SS相对于S以与粒子1的水平速度相等的速度运动,所以在S下粒子1是垂直向上运动再反弹的,而粒子2的水平速度加快,其碰撞张角变得更大了。在S下,竖直方向的动量依然守恒,因此设粒子1在S下的垂直速度为w,粒子2在S下的水平速度为u,速度为v,粒子2在S下与水平方向夹角为α,那么得到mww=mvutanα。我们再取一个参考系S,这个参考系相对于Su的速度向左运动,于是粒子2变成竖直运动了。根据对称性这不过是S中情况的颠倒,因此S中粒子2的速度就是w。用洛伦兹的速度变换把它变换到S中,得到S中粒子2的竖直速度为w1u2/c2。因此utanα=w1u2/c2。代入动量守恒的式子得到mww=mvw1u2/c2。也即mwmv=1u2/c2。现在令w0,那么mwm0,由于竖直方向速度很小,因此α0u,v趋向同一个值,因此mvmu。因此m0mu1u2/c2,也就得到了最终的mu=m01u2/c2

m=m01v2/c2恰好保证了物体的运动速度不能超过光速。受恒力的物体在牛顿力学下会不断加速直到速度无穷大,但在相对论动力学下外力做功增加的不是物体的速度而是动量,动量的增大在速度接近光速时只表现为质量的增大,而此时速度的增加量趋向0。

相对论性能量

现在我们通过一个非弹性碰撞的粒子来研究能量。假设两个相同粒子以速度w相撞然后粘在一起静止。在一个垂直速度w的以微小速度u运动的参考系下观察这次碰撞,碰撞前垂直方向总动量约为2mwu(由于u无穷小,其质量近似于原参考系中的mw),碰撞后垂直方向总动量为Mu。因此2mw=M。而M也近似为两粒子碰撞后在静止参考系中的总质量。可见碰撞后的总质量M=2mw>2m0——为了使两物体碰撞时动量守恒成立即使在碰撞后形成的物体处于静止状态其质量也必须大于物体静止的质量之和。

两粒子的质量碰撞前之所以是mw是由于运动,这个动能以“质量增加”的方式表现出来。在碰撞后发生能量损失,能量又以质量的方式附加在了物体上。这意味着能量具有惯性。爱因斯坦观察到如果用mc2来表示总能量时运算会得到简化。当我们把m01v2/c2写作m0(1v2c2)12并用广义二项式定理展开得到m0(1+12v2/c2+38v4/c4+)时,我们在v比较小时舍去四次以上的项得到mm0+12m0v2/c2,因此ΔmΔEkc2。所以如果等式两边同时乘以c2,得到mc2=m0c2+12m0v2+。第二项恰好是物体的动能,而第一项可以理解为某种“静能”。所以如果我们姑且假设物体的总能量始终为E=mc2,我们会发现这样的假设正好会得出m=m01v2/c2的结论——

根据能量的定义,dEdt=Fv。根据动量的定义,F=d(mv)dt。于是得微分方程dEdt=vd(mv)dt。代入E=mc2,得到c2dmdt=vd(mv)dt。两边同时乘以2m,得c22mdmdt=2mvd(mv)dt,根据微分的运算法则c2d(m2)dt=d(m2v2)dt,两边同时积分得c2m2=m2v2+C,当v=0c2m02=C,因此c2m2=m2v2+c2m02。因此解得m=m0cc2v2=m01v2/c2

可见,在相对论下“质量”和“能量”是相当的,实验已经证明了这一点。在原子弹爆炸时,正是微小的质量亏损释放出了巨大的能量。

最后我们发现,速度v、动量p、总能量E能以一个相当简单的方式联系起来。对m=m01v2/c2两边同时平方得到m2(1v2/c2)=m02,于是m2c4m2v2c2=m02c4,得到了E2p2c2=m02c4。还有一个关系也很常用,在E=mc2两边同时乘以v得到Ev=pc2

对光子来说,根据量子力学E=hν,p=h/λ,得到E=pc,代入解得m0=0,既光子的静止质量为0。但我们不能代入E=m0c21v2/c2说光子的能量也为0,因为光子的速度始终为c,这是个0/0的未定式。事实上光子实际上具有能量,这个能量正是它永远以光速运动才具有的能量。

时空

我们已经在使用(x,y,z,t)这样一个四维空间里的坐标来表示一个事件了。如果把洛伦兹变换看作一个作用在这样一个矢量上的变换,它具有什么样的含义?我们发现洛伦兹变换的数学形式和矢量的转动是很相似的。平面上的矢量(x,y)在平面上转过θ角时做坐标变换x=xcosθ+ysinθ,y=ycosθxsinθ。对于洛伦兹变换中的xt,假如我们在t上附加一个光速的因子,它的形式就变得和转动相同。对于转动,“模长”x2+y2是保持恒定的,类似地我们可以验证在洛伦兹变换下,矢量(x,y,z,t)始终保持x2+y2+z2c2t2恒定。

于是我们试图把矢量的观念进行扩展,使其包含时间的分量。这样的四维矢量在“时空”这样一个四维的向量空间中。如何理解这样一个四维空间呢?我们可以这样类比:当我们观察一个三维空间中的立方体时,假设我们始终正对着立方体的一个面并观察者只能前后移动,那么我们的移动只会导致我们观察到立方体宽度的变化,我们无法观察到立方体深度的变化。但假设此时我们可以在三维空间中的任何位置观察,这时我们不仅有立方体的宽度还会观察到立方体有深度。当我们的观察点转过一个角度时,立方体的宽度和深度同时变化。我们用同样的方式来看待洛伦兹变换,它是空间与时间的混合。由于日常经验不足以让我们接触到高速,因此我们平常的观察视角都局限于空间这三个维度上。现在当我们的观察视角掺入了时间的维度后,观察点(参考系)的变化将会同时引发空间和时间的变换。我们认为占有空间并延续了某一时间间隔的物体在新的世界里占有了“一个小块”,这个新的世界就是“时空”,我们对这个小块的观察在各个维度上随着观察位置的变化而变化。

然而,由于在洛伦兹变化下保持恒定的不是x2+y2+z2+t2而是x2+y2+z2c2t2,我们肯定无法用通常意义下的欧氏几何来想象“时空”。但不难预料“时空的几何学”应当是与欧氏几何类似的。我们把x2+y2+z2c2t2这个量看作是三维空间中的距离一样的“实在”,把它称为两个时空点之间的间隔(的平方)。“实在”指的就是不随观测点的改变而变化的量。

在三维空间中,我们很容易接受三个方向的“空间”是等价的。在四维的时空中,我们也希望看到四个维度是等价的。但我们在经验中却用不同的单位来衡量空间(米)和时间(秒),这就好像在三维空间中用“米”来衡量x,y方向的空间却用“英尺”来衡量z方向的空间一样。现在我们希望把时间的单位和空间的单位统一起来,我们利用的就是x2y2z2c2t2这四项的等价性,这四项的单位应当是一样的。因此应当有m2=c2s2。即1 m=c s。如果时间和空间都同一用“米”的单位来表示,那么洛伦兹变换可以写成更简单的形式。原本的x=xut1u2/c2中的t的单位是秒,现在一秒等于1/c米,因此t s要用t/c m来代换。同样速度u的单位是m/s,现在要代换成c。因此得到的结果是x=xut1u2。时间也是同理,最终我们得到同一单位下的洛伦兹变换

x=xut1u2y=yz=zt=tux1u2

当我们用模长来类比时空间隔时,我们把x2+y2+z2c2t2类比为了间隔的平方。但这个表达式不具有平方和的非负性,因为出现了负号。因此时空间隔可能是虚数。当时空间隔为实数时,我们称它为“类空间隔”,因为它更像空间的间隔;而当它为虚数时,我们称它为“类时间隔”。在时空中存在这样一些点形成的曲面,它们与原点的间隔始终为0,在这个曲面的两侧的点分别与原点的间隔为实数和虚数。这个曲面称为“光锥”。我们容易理解,光锥上的点(事件)恰好是那些零时刻从原点出发的光在任意时刻产生的事件。更一般的,从某一点出发的光到达的点之间的间隔始终为0。“光速在任意坐标系下都相同”现在可以表达为“在某坐标系下间隔为0的两点在任意坐标系下间隔都为0”。

我们把光锥想象成一个四维空间里的“圆锥”。光锥之内负的时间轴的那半部分与原点的间隔是类空间隔,这些事件可以影响到原点(“此刻”),因为以某个恰当的小于c的速度出发它能够到达原点,这部分区域称为“可感知的过去”;光锥之内正的时间轴的那半部分与原点的间隔也是类空间隔,原点可以影响到这部分区域,称为“有影响的未来”。而光锥之外的部分与原点的间隔为类时间隔,它既不能影响到原点,我们也不能以原点来影响它。例如太阳的爆炸只能影响到八分钟以后的地球,在那之前地球处于太阳的光锥之外,不可能受到太阳的影响。事实上,当我们说“此刻”时,这只是一个基于人们日常经验的未定义的概念。我们看到的太阳是八分钟以前的太阳,“此刻”的太阳如果指的是地球参考系下与地球上某个事件同时的太阳的话,那这只是头脑中的一种想象,因为它永远无法被观测到,因此在物理上是不可定义的。并且,“此刻”取决于参考系的选取,因为同时性是相对的,如果太阳相对于地球在运动,那么即便在地球上人想象的此刻的太阳上的人看来的此刻的地球也不是地球上人认为的此刻的地球。

四维矢量

我们通过洛伦兹变换与空间转动的类比猜测存在这样的四维矢量(x,y,z,t),这个矢量本身是比其各个分量更实在的东西,就好像速度本身是比速度的三个分量更实在的东西,因为它不会因为坐标系的变换而改变。事实上,不仅是有空间距离和时间间隔构成的矢量(x,y,z,t)满足这样的性质,我们将会看到由动量的三个分量和能量组成的四维矢量(px,py,pz,E)也满足这样的性质!

为了运算的简便,我们在此修改各个物理量的单位使得它们在时空上得到统一。例如能量和质量,根据E=mc2质量和能量只相差光速的因子,所以可以统一为同一个单位,我们直接认为能量就是质量。于是写出E=m=m01v2p=mv=Ev=m0v1v2。此时E2p2=m02

现在当我们把某个具有速度v的物体的运动变换到另一个相对这个参考系有x方向速度u的新坐标系下时,根据速度的变换公式有v=vu1uv。因此E=m01v2=(m0/1v2)(m0v/1v2)u1u2=Eup1u2。而p=Ev=m0vm0u1u21v2=puE1u2。这恰好与洛伦兹变换的形式相同,也就是我们用四维矢量(px,py,pz,E)的洛伦兹变换

px=pxuE1u2py=pypz=pzE=Eupx1u2

也就是我们发现了一个比动量和能量都更“实在”的矢量,它的空间分量是动量,时间分量是能量。我们依然把这个矢量称为动量,它的时间分量就是能量。当我们把动量守恒推广到相对论中时,它不仅代表了三维空间意义下的动量守恒,还包含了能量守恒。

由于四维矢量的长度现在必须定义为x2+y2+z2t2(省略了光速因子),而长度是矢量与自身的点积,因此我们把四维矢量的点积定义为μAμAμ=Ax2+Ay2+Az2At2。因此,四维动量矢量(px,py,pz,E)的长度平方就是p2E2。我们导出过E2p2=m02,所以它的长度其实表示的就是物体的静质量。

在这里,我们清楚地看到了时间和空间的统一性。正如闵可夫斯基所说:“空间本身和时间本身将消失在完全的阴影之中,只有它们之间的某种结合才将得以生存。”

posted @   行而上  阅读(292)  评论(2编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
历史上的今天:
2018-07-21 Codeforces518 D. Ilya and Escalator
2018-07-21 [POJ2096] Collecting bugs
2018-07-21 [ZOJ3329] One Person Game
2018-07-21 [LightOJ1038] Race to 1 Again
点击右上角即可分享
微信分享提示