统计力学
现在开始讨论一个新的课题:从“物质由大量原子组成,它们之间存在着电相互作用,并遵从力学定律”这种物理观点出发,我们企图了解为什么不同的原子集合会表现出它们所具有的特色。这是一个困难的课题,它和力学和电学有着很大的不同:在学习力学和电学的过程中,我们能够从某些基本定律出发本质地理解一大批现象,再以这些现象为基础了解更多的东西,换言之我们只是在学习用以更好处理问题的数学方法。而研究物质的性质时,一方面现象与定律之间相隔太远,尽管每一步的分析我们都尽量做到精确,而最后的结果却越来越不精确;另一方面,从经典物理学定律出发推到的结论很多时候在根本上就是不正确的,因为原子的行为遵循的实际上是量子力学规律;同时,对这些现象的分析需要对概率论有深刻的了解,因此我们只是着重从重要的地方出发作近似,对这些现象有个大致的了解。
从原则上来说,我们认为物质的总体性质都应当能借助于它的组成部分的运动来加以解释。在这里我们只限于讨论“热平衡状态”。用于热平衡状态的力学定理称为“统计力学”。
气体分子动理论
首先我们从大量互相碰撞的原子出发讨论物质的一些性质,这部分内容都是从原子碰撞的观点出发来描写物质的,称为“气体分子动理论”。
压强
我们谈论的“压强”本质上是分子运动撞击物体产生的力。为了定量对这种现象做出分析,我们设想有一个容器,容器里充满气体分子,右端是一个活塞。如果不在活塞上施加一个力F,活塞就会因为受气体分子的撞击而运动。当F的大小恰好使得活塞平衡时,我们就可以用F来表示气体分子的撞击力了,因为它们二者相等。
表示力的一种方法是考察每单位面积上的力。我们认为活塞上受力应当是均匀的,因此我们可以用单位面积上的力\dfrac{F}{S}来表示活塞受到的力,这就定义为压强P。
还可以从做功的角度来理解这个定义。根据dW=-Fdx,代入F=PS,就得到dW=-PSdx,而在我们的模型里Sdx=dV,因此dW=-PdV。即压强乘以体积的变化量等于做功。
现在我们想建立压强与分子运动之间的联系。我们认为分子和活塞的碰撞是弹性碰撞。这是合理的,因为否则我们就会产生额外的能量,而在我们设定的平衡条件下气体有稳定的运动状态,活塞也没有损耗能量。在三维空间中,与活塞发生弹性碰撞的气体分子只在一个坐标方向上(不妨设为x)速度反向,其它速度不变,因此动量变化量为2mv_x。考虑很短的一段时间\Delta t,只有在x方向上与活塞相距v_x\Delta t内的分子才会打到活塞上。设单位体积内分子数为n,计算出活塞受到的冲量为F\Delta t=n v_x \Delta t S m(2v_x)。解得P=2nmv_x^2。可是并非所有分子的v_x都相同,因此我们需要取平均值——首先,只有一半的分子是从左往右运动的,还有一半运动方向相反,因此一定不会打到活塞上,因此我们需要除一个因子2。其次考虑向右运动的分子的v_x,由于分子的运动是四面八方的,它没有理由特别青睐某一个方向,因此各个方向上的平均速度都应当相等, 因此\lang v_x^2\rang=\lang v_y^2\rang=\lang v_z^2\rang,因此\lang v_x^2 \rang=\dfrac{1}{3}\lang v^2 \rang。这样代入就得到P=\dfrac{1}{3}nm\lang v^2 \rang。由于单个分子的动能是\dfrac{1}{2}mv^2,因此我们可以把压强表示成P=\left(\dfrac{2}{3}\right)n\left\langle\dfrac{1}{2}mv^2\right\rangle。
如果气体分子是单原子分子,那么平均动能\left\langle\dfrac{1}{2}mv^2\right\rangle乘以总原子数就是该气体的全部能量,因为每个分子内部没有其余内部的能量了。我们把这个总能量记为U,并把n表示为总原子数除以总体积\dfrac{N}{V},就得到压强和能量的关系PV=\dfrac{2}{3}U。这里的系数2来自动能,它是积分的结果;系数3来自我们空间的维数是3。
如果我们把活塞缓慢往里推,始终保持活塞平衡,那么外力F将做功,根据压强的定义dW=-PdV。假设外力做功把能量全部转化为气体内部原子的能量(这个过程称为绝热过程,当然我们还没定义什么是“热”,我们现在就把“热”等同地理解为气体的总能量(内能);绝热过程是我们设想的理想情况,在现实中分子的撞击会带动容器壁的运动,从而带动容器外的分子运动,这样能量就耗散出去了),那么dW就加在U上,dU=-PdV,而\dfrac{2}{3}U=PV。这样我们就写出了一个微分方程:\dfrac{2}{3}dU=d(PV),即-\dfrac{2}{3}PdV=VdP+PdV。为了更一般地讨论这个方程,我们记\gamma-1=\dfrac{2}{3},那么我们的方程就是-(\gamma-1)PdV=VdP+PdV,分离变量得-\dfrac{\gamma dV}{V}=\dfrac{dP}{P},积分得-\gamma\ln V=\ln P+C,得PV^{\gamma}=C':在绝热过程中压强和体积的\gamma次方的乘积为定值。在单原子分子的情形中,\gamma=\dfrac{5}{3},因此PV^{\frac{5}{3}}为定值。人们已经用实验验证过确实如此。
P=\dfrac{1}{3}nm\lang v^2 \rang可以写成动量的形式P=\dfrac{1}{3}n\lang p \cdot v\rang,这样我们就可以讨论“光子”这样的物质的压强了。太阳还不够热,其中仍有太多的原子。在更热的恒星中,我们可以忽略原子,认为唯一的客体就是光子。对光子来说,p \cdot v = mc^2=E,因此压强的式子写作PV=\dfrac{1}{3}U,在这里\gamma = \dfrac{4}{3},因此对于光子的绝热过程来说PV^{\frac{4}{3}}是定值。这就是辐射的压缩性,是我们用来分析恒星上辐射压强贡献的关系式。
温度
在压缩气体的时候,分子的能量增加,我们的日常语言通常把这种现象描述为“气体变热了”。“变热”这一事实指的是物体“温度升高”。但什么是温度呢?经验表明,当我们使一个“热的东西”和一个“冷的东西”接触足够长的时间以后,它们最终会到达“相同温度”的状态——“温度高的东西”会将“热量”向“温度低的物体”传递,哪怕它本身具有的能量是更低的。把一个微小的火苗靠近一座冰山,结果是火苗的温度降低,冰山的温度升高,但显然冰山由于分子众多应当具有更大的能量。日常经验说明有“温度”这样一个量存在。那么温度到底度量的是分子层面的什么呢?
设想一个封闭容器的中间有一个活塞,活塞的两边是两种不同的气体。这是为了类比两个接触的物体。那么“温度的相同”就反应为“活塞平衡”,如果温度不同活塞就要运动,直到最后建立起一个平衡。活塞的平衡等价于两边气体压强相同,即P_1=\left(\dfrac{2}{3}\right)n_1\left\langle\dfrac{1}{2}m_1v_1^2\right\rangle=\left(\dfrac{2}{3}\right)n_2\left\langle\dfrac{1}{2}m_2v_2^2\right\rangle,化简得到n_1\left\langle \dfrac{1}{2}m_1v_1^2\right\rangle=n_2\left\langle \dfrac{1}{2}m_2v_2^2\right\rangle。这个平衡有没有可能是n_1>n_2,而\left\langle \dfrac{1}{2}m_1v_1^2\right\rangle<\left\langle \dfrac{1}{2}m_2v_2^2\right\rangle形成的呢?如果是这样,那么活塞受到的是一种不稳当的压力——撞击不是绝对均匀的,左边原子较多而能量较小,发生的是频繁的小撞击,而右边原子较少能量较大,发生的是缓慢的大撞击——这样的撞击会导致活塞产生晃动,这种晃动将影响两侧气体的运动,换言之它引起了两边气体的能量交换,直到达到某种平衡,在单位时间内两边的能量交换是相等的。我们最终会证明,达到平衡时两边的平均动能是相等的,因此必须要求两边的原子数是一样多的,不然活塞就永远不可能平衡。
这是一个困难的问题。我们先来分析另一个问题,假设我们把两种气体放进同一个容器。那么显然,如果其中一个气体的所有分子都静止而另一种气体的所有分子都运动,那么碰撞会使得原来静止的气体分子动起来;如果一种气体的分子动的全都比另一种快,那么一会儿后慢的气体也会快起来。我们想要分析的是平衡时它们的速度会是怎么样的。这依然是一个困难的问题。我们这样来分析:在研究弹性碰撞的时候我们证明过相对两个物体的质心,碰撞前后物体的速度只改变方向不改变大小。气体分子的碰撞不一定是对心碰撞,碰撞后它们保持原先的速率可能飞向任何方向。因此我们选取某个特定的点,质心保持在这个点上静止的任意两个分子在空间中沿所有方向运动的概率都是相等的。而在实际情况中,任意两个分子的质心不一定是静止的,因此速度需要叠加上质心的速度v_{CM}=\dfrac{m_1v_1+m_2v_2}{m_1+m_2}。此时结论变成了“两个分子的相对速度方向相对于质心的速度v_{CM}在任何方向上都是相等的”,即两分子的相对速度相对于质心速度v_{CM}的夹角是均匀分布的,这意味着v_1-v_2在v_{CM}上的投影的“平均值”为0,即\lang (v_1-v_2)\cdot v_{CM} \rang=0。代入得\left\langle \dfrac{m_1v_1^2-m_2v_2^2+(m_2-m_1)v_1 \cdot v_2}{m_1+m_2}\right\rangle =0。即m_1 \lang v_1^2\rang -m_2\lang v_2^2\rang+(m_2-m_1)\lang v_1 \cdot v_2\rang=0。\lang v_1 \cdot v_2\rang显然为0,因为任意的分子的运动方向都是任意的,对于每个确定的v_1都有v_1 \cdot v_2的平均值为0,综合起来依然为0。这样我们就分析得到了必须有\left\langle \dfrac{1}{2}m_1v_1^2\right\rangle=\left\langle \dfrac{1}{2}m_2v_2^2\right\rangle。
那么假如气体是被分开的,是否也有相同的结论?我们想象容器内有一块隔板,隔板中间有一个小孔,它只能让其中一侧的分子漏过去,由于是弹性碰撞,气体的总能量是不会发生变化的,所以混合的气体的能量的结论可以直接拿过来用。如果这个隔板是活塞,我们可以证明活塞的动能(水平运动的能量)也和气体的平均动能相同。
所以,当两种气体“处于相同温度”时,它们的平均动能相等。这表明“平均动能相等”是“平衡时的一种现象”,所以我们就用“平均动能”来度量“温度”,以使其满足“平衡时相等”这一特性。因此最好的办法就是把平均动能本身作为温度的定义,但为了方便,我们在它们之间乘上一个系数——
理想气体定律
——来使得它代入压强的表达式的时候写的简洁。根据PV=\left(\dfrac{2}{3}\right)N\left\langle\dfrac{1}{2}mv^2\right\rangle,我们就把\dfrac{2}{3}\left\langle\dfrac{1}{2}mv^2\right\rangle定义为kT,其中T是温度,k=1.38 \times 10^{-23}\text{ J/K}。因此分子的平均动能就可以写作\dfrac{3}{2}kT,沿某一方向的平均动能就是\dfrac{1}{2}kT。
选择这样的系数以后,在标准情形下T=273时恰好是水结冰的温度,T=373时恰好是水沸腾的温度。T=0就是绝对零度。它的单位是开尔文,开氏度减去273就得到摄氏度。
由此我们得到了公式PV=NkT,这就是理想气体定律。为了方便,我们用摩尔而不是原子数来计数, 基于阿伏伽德罗常数N_0=6.02 \times 10^{23},定义R=N_0 k=8.317 \text{J} \cdot \text{mol}^{-1} \cdot \text{K}^{-1}。这样理想气体定律就写作
——根据牛顿定律,在同样的温度同样的压强下,相同体积的不同气体具有相同的分子数!这是一个令人惊异的结论。
到现在为止,我们只讨论了单原子气体分子。那多原子分子的情况怎么样呢?“多原子分子”和“单原子分子”的不同之处只在于我们需要考虑原子之间的作用力,也即现在若干个原子组成的分子内部之间有了力在作用。我们可以认为“\left\langle\dfrac{1}{2}mv^2\right\rangle=\dfrac{3}{2}kT”这个定律依然成立。因为我们考虑的核心是气体分子的碰撞。我们之所以怀疑多原子气体分子在这个定律上的正确性,在于此时气体分子内部有作用力,但这些作用来碰撞这种“瞬间作用”下是可以忽略的,因此我们的整个论证都是依然可行的。
如果只考虑多原子分子的质心会怎么样呢?假设我们讨论双原子分子,那么M=m_1+m_2,v_{CM}=\dfrac{m_1v_1+m_2v_2}{M},于是\dfrac{1}{2}Mv_{CM}^2=\dfrac{m_1^2v_1^2+m_2^2v_2^2+2m_1m_2(v_1 \cdot v_2)}{2M}。同时给两边取平均, 发现\left\langle\dfrac{1}{2}Mv_{CM}^2\right\rangle=\dfrac{m_1^2\lang v_1^2\rang+m_2^2\lang v_2^2\rang+2m_1m_2\lang v_1 \cdot v_2 \rang}{2M}。我们已经证明了\left\langle\dfrac{1}{2}m_1v_1^2\right\rangle=\left\langle\dfrac{1}{2}m_2v_2^2\right\rangle=\dfrac{3}{2}kT,而显然\lang v_1 \cdot v_2 \rang=0(不会偏爱某个方向),因此得到\left\langle\dfrac{1}{2}Mv_{CM}^2\right\rangle=\dfrac{m_1^2\lang v_1^2\rang+m_2^2\lang v_2^2\rang+2m_1m_2\lang v_1 \cdot v_2 \rang}{2M}=\dfrac{m_1+m_2}{M}\cdot \dfrac{3}{2}kT=\dfrac{3}{2}kT。这个结论也可以推广到更多原子的分子——质心的平均动能等于\dfrac{3}{2}kT。
我们把一个原子“独立的运动方向”称为一个“自由度”,单原子的自由度是3,\gamma个原子组成的分子自由度是3\gamma,因为每个原子都需要三个坐标来确定它的位置。所以我们的定理可以表述为“每个自由度的平均动能为\dfrac{1}{2}kT”,以及“质心的平均动能为\dfrac{3}{2}kT”。于是我们可以得到一个\gamma个原子的分子的平均动能为\dfrac{3}{2}\gamma kT,其中\dfrac{3}{2}kT是质心的动能,余下的\dfrac{3}{2}(\gamma -1)kT是分子内部的振动和转动动能。
分子的空间分布与速度分布
玻尔兹曼定律
我们已经得到了统计力学的第一个定理——在温度T下分子的每个自由度的动能平均值都是\dfrac{kT}{2}。它告诉了我们有关原子的“方根均速度”的某些知识。现在,我们想要对原子的位置和速度的了解更多一点。
假设有一个伸展得很高的气柱,处于热平衡状态。热平衡状态下,空间的每一点处温度均相等,即分子的平均动能处处相同。因为如果不相同,大的地方的分子就会带动小的地方的分子运动,这意味着平衡还没有达成。所以对于所有位置,都满足P=nkT,其中T,k是常数,但P不是常数——类比深海处的压强,因为物质具有重力,对某一深度处具有一定厚度的一层物质分析,从下往上的力要超过从上往下的力,这样才能平衡掉这部分物质本身的重力。所以写出P_{h+\Delta h}S+mgnS\Delta h=P_h S(其中地面高度为0,m是单个分子的质量),得到\text{d}P = mgn \text{ d}h。由于P=nkT,这意味着n也不是常数,代入得到微分方程dP=dn \cdot kT=mgn \ dh,即\dfrac{dn}{n}=\dfrac{mgdh}{kT},积分得\ln n = \dfrac{mgh}{kT}+C,解得n=n_0e^{-\frac{mgh}{kT}},其中n_0为h=0处单位体积内的分子个数。——这告诉我们在气柱中,高度越低分子密度越高,分子密度随着高度的增加而指数衰减。
我们注意到我们得到的表达式n=n_0e^{-\frac{mgh}{kT}}中带有“mgh”这一项,它表示重力势能。我们发现我们在解微分方程的时候“力”的这一项是作为整体被处理的,也就是说如果分子受到的是复杂的力,只要我们能定义每个原子的势能(必须是保守力,不然不仅无法定义势能,连热平衡都无法达成),也可以相应地写出一个分子密度的表达式:(在这里我们把高度也推广为了空间中的某个位置)
这就是玻尔兹曼定律,它是统计力学的另一条原理,描述了空间中分子密度随着势能的负值除以kT作指数变化。
我们可以用概率来理解“密度”:分子密度函数可以看作一种概率分布,如果我们单独看一个粒子它出现在空间的哪个位置的概率最大,答案是分子密度最大的地方。
这样我们就可以讨论分子的空间位置分布。对于分子间作用力人们已经得到了一个大致的了解了,当分子靠近时它们强烈地排斥,但离远了却又产生吸引。由此我们得到了一个两个分子间的势能函数V(r),在无穷远处为0,越靠近越递减,相互作用力为0时达到势能极小值点,只有陡然上升达到正无穷。这里分子间作用力是两体力, 类比万用引力和库仑力,对于一个充满分子的容器,某点处某分子的势能就定义为对所有其它分子的势能函数求和,这样我们就依据玻尔兹曼定律写出n=n_0e^{-\frac{\sum V(r_{ij})}{kT}}。所以假设我们已经知道了所有r_{ij},我们就可以知道在某位置找到一个分子的概率正比于e^{-\frac{\sum V(r_{ij})}{kT}}。因此,概率最大的位置就是\sum V(r_{ij})取最小值(负的最大值)的位置。 比如,当只有两个分子的时候, 它们之间的距离就倾向于势能的极小值处,也就是互相作用力为0的时候——分子更加喜欢处在能量较少的距离上。而如果温度非常高,使得kT \gg \sum V(r_{ij}),也就意味着找到分子的概率与位置几乎无关,分子的运动杂乱无章。这体现出温度低时分子集聚形成液体、固体,而对它加热则会使它“蒸发”。
虽然我们已经在形式上解决了粒子的空间分布问题。这是人们常常说的“多体问题”,尽管简单的公式包括了所有细节,但由于数目巨大,同时有大量的变化,问题依然无比复杂。因此统计力学的根本课题不在于写出定律,而是如何从形式解中找出特殊的信息。这依然是困难的问题。
麦克斯韦分布
下面讨论分子速度的分布。依然像刚才那样假设有一个气柱,我们已经看到如果考虑分子间作用力会出现复杂的情况,因此我们暂时忽略分子间的作用力。
我们已经看到在气柱中越高的地方分子越少,但从运动的角度看也是如此——一个处于底层的分子要具有足够大的动能才能够克服重力做功到达高处。由于热平衡时各处温度都相同,所以各处的平均分子动能是相同的,也即速度分布是相同的。假设一个分子在h=0处从下往上以速度u运动能够到达高度h',那么我们可以认为同时也有相同的概率一个分子能在高度h'上从下往上运动(由于我们忽略碰撞,可以想象就是这个分子本身运动上去了)。进而,设mgh_1 = \dfrac{1}{2}mu^2,那么所有在h=0处从下往上以大于u的速度运动的分子总数应当恰好与在h=h_1处从下往上以大于0的速度运动的分子总数相等。由于总数相等,因此对应的密度也相等,即n_{>u}(0)=n_{>0}(h_1)。而根据速度分布相同,在h=h_1处速度大于0的分子总数比上h=0处速度大于0的分子总数之比就是对应的密度之比, 根据玻尔兹曼定律有\dfrac{n_{>0}(h_1)}{n_{>0}(0)}=\dfrac{n(h_1)}{n(0)}=e^{-\frac{mgh_1}{kT}}。这样联立一下我们就建立了同一个高度的不同速度的分子密度之比的关系式:n_{>u}(0)=n_{>0}(0)e^{-\frac{mgh_1}{kT}},其中mgh_1=\dfrac{1}{2}mu^2,因此
这相当于给出的是速度分布的积分要满足的一个关系式,我们可以由此直接解出概率函数f。首先必须满足\displaystyle\int_{-\infty}^{+\infty}f(x)dx=1。然后我们考虑这个关系式:f(u)代表某高度处分子速度为u的概率,而分子密度指的是单位时间通过该高度平面的分子数,我们要为这两者建立联系。我们意识到如果要在这一秒内穿过h=0处,那么对于速度为u的分子只需考虑所有高度范围在[-u,0]范围内的。因此n_{>u} \propto \displaystyle\int_{u}^{+\infty}xf(x)dx。所以写出\displaystyle\int_{u}^{+\infty}xf(x)dx=C \cdot e^{-\frac{mu^2}{2kT}}。两边同时对u求导得-uf(u)=-C\cdot \dfrac{mu}{kT}e^{-\frac{mu^2}{2kT}}。得到f(u)=C\cdot \dfrac{m}{2kT}e^{-\frac{mu^2}{2kT}}。为了满足\displaystyle\int_{-\infty}^{+\infty}f(x)dx=1,即满足C\cdot \dfrac{m}{2kT}\displaystyle\int_{-\infty}^{+\infty}e^{-\frac{mu^2}{2kT}}du=1。换元,C\cdot \dfrac{m}{2kT}\sqrt{\dfrac{2kT}{m}}\displaystyle\int_{-\infty}^{+\infty}e^{-\frac{mu^2}{2kT}}d\left(\sqrt{\dfrac{m}{2kT}}\cdot u\right)=C\cdot \sqrt{\dfrac{m}{2kT}}\displaystyle\int_{-\infty}^{+\infty}e^{-x^2}dx=1。我们在数学分析课上用重积分算出过这个Poisson积分\displaystyle\int_{-\infty}^{+\infty}e^{-x^2}dx=\sqrt{\pi}。代入解得C=\sqrt{\dfrac{2kT}{\pi m}}。这样我们就解出了f(u)=\sqrt{\dfrac{m}{2\pi kT}}e^{-\frac{mu^2}{2kT}}。其中\dfrac{1}{2}mu^2这一项就是动能,因此我们也可以写作
这称为麦克斯韦分布。把它和玻尔兹曼定律结合起来,我们发现它们具有相同的形式!不同只在于位置分布中能量的项是势能,速度分布中能量的项是动能。由于速度正比于动量,如果我们用“动量分布”来取代“速度分布”,会发现这个结论推广到相对论中也是成立的。 并且如果我们综合考虑三个方向,就相当于把三个方向的概率相乘,写出f(p_x,p_y,p_z) \propto e^{-\frac{E_k^{(x)}}{kT}}e^{-\frac{E_k^{(y)}}{kT}}e^{-\frac{E_k^{(z)}}{kT}}。
经典物理的失败
为了检验这些统计力学定律,我们通过实验测量出的气体\gamma值和理论来对比。我们已经证明单原子分子的\gamma = \dfrac{5}{3}。对于双原子分子,每个原子的动能都是\dfrac{3}{2}kT,因此总动能是3kT,而我们知道质心动能是\dfrac{3}{2}kT,因此分子内部转动和振动的总能量为\dfrac{3}{2}kT,其中振动只有一个自由度,转动有两个自由度,因此振动动能为\dfrac{1}{2}kT,而我们知道对于振子来说平均动能等于平均势能,因此我们还要考虑到一个\dfrac{1}{2}kT大小的振动势能。综上我们得到双原子分子的总能量为\dfrac{7}{2}kT。根据PV=(\gamma-1)U=(\gamma-1)\dfrac{7}{2}kT\cdot N,因此(\gamma-1)\dfrac{7}{2} = 1,解得\gamma = \dfrac{9}{7} \approx 1.286。然而在实验中,我们通过PV^{\gamma}守恒来测出\gamma,却发现氢气的\gamma=1.404,氧气的\gamma=1.399。但是溴的值是1.32,比较相符。对于更复杂的多原子分子,由于能量更大,\gamma应该更接近1,但却测得乙烷的值达到1.22,这也是不可理解的。
并且在经典力学的预言下,\gamma应当与温度无关。但实验却测得\gamma随温度变化,温度越低\gamma越大。这似乎意味着随着温度的下降,分子的某些运动被“冻结”了。这种“冻结”只有在量子力学出现后才得到解释,这是物理学家第一次发现经典物理定律的错误。
根据量子力学,一个被势(例如振动势)束缚的系统具有一组分立的能级。因此我们刚才推出的分子分布不应当是连续的,而是离散的。即我们有一组能级E_0,E_1,\cdots,E_i,\cdots,那么我们的定理应该修改为\propto e^{-\frac{E_i-E_0}{kT}}。在E_1态找到分子的概率比E_0小e^{\frac{\hbar \omega}{kT}}。因此在温度很低的时候,对于氢原子,从一个能级到跳下个能级的概率是很小的,振动无法做出贡献。但是碘分子质量大, 它的固有频率低,因此经典的振动能显现了出来。当我们开始增加温度的时候,概率逐渐变大,量子化的状态开始变得和连续态无法区分,此时我们的统计力学定律恢复正确。
分子动理论的应用
从分子动理论出发,我们能够或多或少理解事物的行为应当如何。这些行为非常复杂,以至于我们的讨论都相应地是不精确的。但即使只是或多或少知道一点为什么它的行为会是那样也是非常有用的。并且,这些讨论本质上还是正确的,应用更高级的知识就可以对它们在细节上做优化。
能量均分
热平衡状态下,我们的一个重要假设是:如果某个系统在温度T下处于热平衡状态,那么它与任何其它处于T下热平衡状态的系统都处于热平衡状态。比如某一气体温度为T并且达到热平衡,令一种气体也处于温度T并达到热平衡,那么把它们混合以后一定依然处于T下的热平衡状态。因为温度是粒子的平均运动,而这个运动状态是由微粒的碰撞决定的。如果两种气体相遇之后其中一种气体的运动变化了,比如平均速率增加了,这意味着这种气体的温度升高了,这意味着它将以更猛烈的方式撞击另一种气体,从而带动另一种气体运动地更剧烈,换言之我们并没有达到平衡。但我们先前假设了整个系统的温度都为T,而一个温度恒定的系统不会自发地一部分变热,也不会自发地一部分变冷。
因此气体微粒的平均动能是3kT/2这个结论在一个热平衡的系统中,无论其中的粒子是否形态各异,都是成立的。对于质量大一些的粒子,它的速率要慢一些;质量小的粒子速率大一些,但所有粒子的平均能量都是相同的。这就是热平衡状态下“能量均分”的现象。这是分子动理论,也就是牛顿定律推出的结果。
这种能量均分结果运用到辐射的热平衡中,人们推出了黑体辐射的公式,就是在这里人们再次发现了经典力学的错误,并在普朗克的假设下推导出了第一个量子力学方程。
布朗运动
在热平衡状态下,气体或液体中的颗粒也以能量均分的方式做运动。由于受到四周无规则跳动的分子的撞击,颗粒也发生跳动,这种运动最初由布朗在显微镜下发现,称为布朗运动。现在的问题是,我们想要求出在一段给定的相对较长的时间后,一个粒子因为做布朗运动最有可能距离起始位置离开多远。这个问题最初由爱因斯坦解决:
这个问题抽象为单位时间粒子会跳动一个固定的距离L,问足够长时间t以后粒子离开多远。记第N次跳动以后粒子的位置矢量为\vec R_N,那么写出\vec R_N = \vec R_{N-1}+\vec L。两边平方得\vec R_N^2=\vec R_{N-1}^2+\vec L^2 + 2\vec R_{N-1}\cdot \vec L。同时对两边取平均,由于\vec R_{N-1} \cdot \vec L没有任何理由偏爱某个方向,因此等于0,所以写出\lang \vec R_N^2\rang =\lang\vec R_{N-1}^2\rang+\vec L^2,所以累加可得\lang \vec R_{N}^2\rang =NL^2。因此距离的平方距离起点的远近是正比于时间的,因此距离正比于时间的根号量级:\lang R^2\rang=\alpha t。
现在我们想求出系数\alpha。假设在粒子上施加一个力F,那么它会受到一个正比于速度的阻力\mu v。于是我们写出微分方程ma=F-\mu v。其中,\mu是容易在实验室测定的。我们只考虑x方向,并且为了方便取平均在两边同时乘以x,写出mxa+\mu xv=xF_x。其中xa=(xv)'-v^2,因此m(xv)'-mv^2+\mu xv=xF_x。\lang xF_x\rang显然是0,因为它在x方向随机游走。xv应当是一个恒定不变的量(为什么?),因此(xv)'的平均值也为0。所以-m \lang v^2\rang+\mu \lang xv\rang=0。而(x^2)'=2xv,并且m \lang v^2\rang =kT,得到kT=\dfrac{\mu}{2}\dfrac{d}{dt}\lang x^2\rang,即\lang x^2\rang=\dfrac{2kT}{\mu} \cdot t。三个方向加起来得到\lang R^2\rang=\dfrac{6kT}{\mu}\cdot t。这就是布朗运动中粒子平均能跑多远的表达式!
这个方程提供了测量k的最早的方法,只需观察在显微镜下一段时间内粒子运动的位移大小的平均情况我们就可以根据这个方程求解出k。
蒸发
假设有一个体积很大的容器,里面放有一部分在一定温度下和它的蒸气达到平衡状态的液体。假设蒸气分子彼此相距很远,单位体积分子数为n。液体内分子紧靠在一起,每个分子大小为V_a,也即液体内单位体积内分子数为1/V_a。为此我们要假设液体分子之间存在作用力,不然就无法解释为什么它们会紧靠在一起,而在蒸气中由于相距很远我们可以忽略这个作用力。这就说明,想要让一个液体分子跑到蒸气里,就必须对它做功W,这个功也就可以理解为液体中分子具有的束缚能,它应当等于液体中分子势能与蒸气中分子势能的差值。那么根据玻尔兹曼定律n \propto e^{-E_p/kT},\dfrac{n}{1/V_a}=\dfrac{e^{-E_1/kT}}{e^{-E_2/kT}},那么nV_a=e^{-(E_1-E_2)/kT}=e^{-W/kT}。这是一个普遍的结果,左边的nV_a表示的是蒸气中单位体积内分子所占的体积,也就是蒸气在体积意义下的密度,它等于e的某种负的能量除以温度的幂而变化。在实际情况中,W/kT往往非常大,因此取V_a和W为常数是一个很好的近似,e^{-W/kT}已经反映出了蒸气密度的最主要的变化特征。
在上面的论述中,我们简单地使用了玻尔兹曼定律这个平衡状态下成立的规则。为了更好地理解这一切,不妨观察一下所发生的具体细节:蒸气分子不断撞击液体表面,因此不停地有蒸气分子进入液体,也不停有液体分子跑出来。\Delta t时间内距离液体表面v\Delta t高度内的液体大约有一半能进入液体,因此单位时间内到达液体表面上的蒸气分子在单位面积上有N_c=\dfrac{Sv\Delta t \cdot n}{S\Delta t}=nv(忽略常数)。对于跑出液体的分子,根据分子动理论的原理它获得能量W的概率就是e^{-W/kT},速度也为v,设分子的直径为D,占液体表面的面积为A,那么经过\Delta t = D/v恰好能使一个液体分子离开,因此单位时间离开单位面积液体表面的分子数为N_e=\dfrac{(S/A)e^{-W/kT}}{S\Delta t}=\dfrac{v}{AD}e^{-W/kT}。当蒸发达到平衡时,N_c=N_e。于是联立得到nAD=e^{-W/kT}(因为热平衡时速率相同所以可以消去v),由于AD \propto V_a,因此这与我们刚才用玻尔兹曼定律得到的结论是完全一致的。
自然界中存在许多现象与蒸发是非常类似的。许许多多种现象种都有这样的特征,要从某个地方汲取一些能量,它随温度变化的最主要的特征就是一个e的负能量除以kT的指数幂因子。例如,把液体分子的束缚能替换成电子的“逸出功”,我们就可以分析电子逸出金属表面的速率(对逸出功的分析会涉及到量子力学原理);把束缚能替换成电子逃离原子核束缚的能量就可以分析热电离时离子的密度和原子的密度;把两个参与化合反应的复杂物质分别“看作”电子和原子核,就可以分析化学反应发生的速率。所有的速率、密度都和因子e^{-W/kT}紧密地联系在一起。爱因斯坦的光电效应正是这一理论在量子假设下的应用。
非平衡状态
迄今为止我们只讨论了处于热平衡状态下的气体中的分子运动。在远离平衡态的情况下物质的运动是很复杂的,但是当物质的状态非常接近平衡态但又不是平衡态时,讨论是可能的。为了看出这时候会发生什么事情,我们必须一个一个原子来分析。
分子的碰撞
首先来考虑一般情形下分子间碰撞的问题。
对其中一个特定的分子来说,它会不断地与其它分子发生碰撞。假设每个分子在相当长的一段时间T内平均会发生N次碰撞。假设对于一个分子来说每两次碰撞的平均时间间隔为\tau,其中\tau=T/N,那么我们可以把它理解为单位时间内碰撞发生的概率为1/\tau,因此在很短的一段时间dt内碰撞发生的期望次数为dt/\tau。那么我们可以计算出一个分子在较短的时间t内一次碰撞都不发生的概率。设初始时有N_0个分子,经过时间t以后还有N(t)个还没发生过碰撞,由于我们假设了较短的一段时间,我们假设一个分子不可能碰撞超过一次,那么得到微分方程N(t+dt)-N(t)=-N(t)dt/\tau,左式根据微分中值定理写作\dfrac{dN(t)}{dt}\cdot dt=dN(t)。于是解得N(t) =N_0 e^{-t/\tau}。即一个分子经过时间t还不发生碰撞的概率为e^{-t/\tau}。
我们还可以计算出两次碰撞之间一个分子平均会移动多远,l=v\tau。这个距离称为“平均自由程”。与关于时间的分析类似,我们可以得出结论在距离dx内发生碰撞的期望次数为dx/l,经过距离x还没有发生碰撞的概率为e^{-x/l}。而我们还可以从另一个角度来计算平均自由程。设分子的半径为r,当分子球心之间距离在2r以内都有可能发生碰撞,因此一个分子产生的有效的碰撞截面大小约为\sigma_c=\pi(2r)^2。对于一个面积为S的截面,假设它有厚度dx,设单位体积内分子数为n_0,那么这一小片体积中的分子数约为n_0Sdx。在这个截面上可能与一个穿过截面的分子发生碰撞的有效面积为\sigma_c \cdot n_0Sdx。由此可见在这个截面上发生碰撞的概率为\dfrac{\sigma_c \cdot n_0Sdx}{S}=\sigma_cn_0dx,这个概率表达式与具体的截面选取无关,因此它就表示一个分子走过dx内发生碰撞的期望次数,因此\sigma_cn_0dx=dx/l,解得平均自由程l=\dfrac{1}{\sigma_cn_0}。如果把它写成\sigma_cn_0l=1则更好理解,它表示一个分子走过一个平均自由程以后发生碰撞的平均概率为100%,因为那时碰撞截面填满了整片截面。
迁移率
假设气体分子带电(离子),当我们在气体上施加一个电场的时候,每个离子都受到一个恒定的电场力,因此有一个恒定的加速度。但由于存在其他分子,它们之间会因为发生碰撞而无法做匀加速运动,但是我们总是可以观察到离子发生了沿电场方向的“净运动”。这就是我们要讨论的第一种非平衡状态,我们希望能够计算出净运动的速率。
对于受到一个外力F的粒子,我们假设它在每一次碰撞后沿任何方向运动的可能性都相同,因此可以计算出它由F引起的速度(称为漂移速度)大约为v_{漂移}=\dfrac{F}{m}\tau。(这里我们似乎忽略了平均速度带有的常数1/2,但严格的计算表面考虑到各种细节以后这个系数恰好是1)把\dfrac{\tau}{m}整体看作系数\mu,称为“迁移率”,那么v_{漂移}=\mu F。迁移率正比于碰撞之间的平均时间,反比于质量,因为碰撞间隔越久加速时间越长,质量越大加速越困难。
将电场中的情形F=Eq代入,假设粒子在电场的作用下在电势差为V的两平行极板间运动,那么单位时间到达极板的离子数就等于电流,I=\dfrac{v\Delta t\cdot S \cdot n_0}{\Delta t}=Sn_0 \cdot \mu F=Sn_0\mu qE。设两极板间距离为定值d,则E=V/d,那么I=\dfrac{Sn_0\mu q}{d} V,可见电流与电压成正比,这正好是欧姆定律的表达形式,中间的系数\dfrac{d}{Sn_0\mu q}就是“电阻”。
扩散
分子的“迁移”是在外力作用下引起的。假如没有外力,而是把一些分子混合到另一些不同的分子中去,那么由于平衡被打破,新的分子会开始扩散,并在足够长时间后遍布整个容器。这一过程称为“扩散”,它仅仅是由分子间的内力和无规则的碰撞引起的。
我们把原来的分子称为“背景分子”,而把新放入容器的分子称为“特殊分子”。特殊分子与背景分子之间发生无规则的碰撞,但整体却呈现出“扩散”这种“净流动”。我们想计算出这种“扩散”有多快。对于某一截面,\Delta T内左侧向右运动的分子在距离范围v\Delta T内都会穿过截面,右侧也是同样。把这个距离取为平均自由程是合理的,设n_-表示距离左侧l处向右运动的分子密度,n_+表示距离右侧l处向左运动的分子密度,那么单位时间通过单位面积的净分子流J=(n_--n_+)v,根据微分中值定理,n_--n_+=\dfrac{dn_{a}}{dx} \cdot l(忽略常数),其中n_a是分子密度关于空间分布的函数。因此J_x=-lv \dfrac{dn_a}{dx},对于所有方向,用梯度表示为J=-lv\nabla n_a。更仔细地分析结果表面,右边还要乘系数1/3。因此J_x=-\dfrac{1}{3}lv\dfrac{dn_a}{dx}。其中\dfrac{1}{3}lv就称为扩散系数D。可见扩散速度取决于分子的速度、平均自由程以及密度分度情况。
爱因斯坦关系
迁移率与扩散系数之间存在内在联系。根据l=v\tau与\mu=\tau/m,代入D=\dfrac{1}{3}lv可得D=\dfrac{1}{3}mv^2\mu。由于情况接近于平衡态,我们利用分子动理论的结论\dfrac{1}{2}mv^2=\dfrac{3}{2}kT,得到D=\mu kT。这个方程的系数恰好就是正确的,而不是忽略常数意义下的“正确”。如果把条件设置为平衡态,即迁移率与扩散相互抵消时,我们可以由这个关系推出玻尔兹曼定律。这再次验证了系数的正确性。这一联系首先是由爱因斯坦推得的。
热导率
用类似的方法我们可以计算热导率。热量由较热的气体向较冷的气体传递是由于带有较大能量的“热”分子的扩散和“冷”分子的扩散引起的。为了计算热能流,我们可以计算往下穿过单位面积的分子带到下面的能量与往上穿过单位面积的分子带到上面的能量之差。热导率\kappa就定义为单位时间的这个能量差与温度梯度的比值,\dfrac{1}{S}\dfrac{dQ}{dt}=-\kappa\dfrac{dT}{dt}。我们可以用类似的方法得到\kappa=\dfrac{knlv}{\gamma-1}。代入nl\sigma_c=1可得\kappa=\dfrac{1}{\gamma-1}\cdot \dfrac{kv}{\sigma_c},我们发现n被消去了,可见热导率与气体密度无关(在平均自由程相比于容器尺度很小的前提下)。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步