矩阵--量子世界的数字(修)

我看了上篇文章的留言,针对一些问题,我在此篇文章最后的答疑部分进行了回复。

 

  之前说到量子世界的代数体系需要满足乘法不可交换,因此海森堡用矩阵替换了经典世界中的实数。那么矩阵是什么,它的乘法为什么不满足交换律?这个问题将在这篇文章回答。

  

 

一、向量

 

     向量在物理中经常被叫作矢量,一般定义为除了大小还有方向的量。物理中最为简单的矢量是位置矢量$\vec{x}$。在选定原点,并建立空间直角坐标系后,我们可以用三个坐标$x,y,z$表示这个位置矢量。在数学中,我们管这样的物理量叫作向量,通常表示为$(x,y,z)$或$\begin{pmatrix}x\\y\\z\end{pmatrix}$,前者称为行向量,后者为列向量

     当然,这种讲法很枯燥,我也不喜欢。说白了,向量就是把一堆数横着一个个放好,或者竖着一个个放好。向量的维数就是放置数字的个数。横着放的数字组成行向量,竖着放的数字组成列向量,这些数字可以是实数也可以是复数。

    下面为了简单起见,我将向量的维数选为2,也就是向量里面仅有两个数。同时我们把讨论集中于列向量,也就是竖着放的向量。

    我们现在给向量中的数字赋予含义。对于一个真实发生的事件,并且这一事件与y和w两人都有关,我们将第一个数选为此事件对y的负面影响程度,第二个数选为此事件对w的负面影响程度。注意,这里我指的是真实发生的事件,并且负面程度的度量是建立在普世价值观(人民大众)的基础上的。这可能有点抽象,我们来举一例。对于某次活动后发生的粉丝anti事件,真实情况是两名w粉丝追着y骂,那这一事件对y的负面影响没有,我们记为0,对w的负面影响不会小,我们记为1. 那么我们可以把这个列向量记作$v_0=\begin{pmatrix}0\\1\end{pmatrix}$,其中第一个数表示对y的负面影响,第二个数表示对w的负面影响。注意向量$v_0$表示的是事件最真实的没有经过无良媒体演绎的影响程度度量,但我们看到了这个真实事件到现在经过不同媒体报道后产生的负面影响差异非常大。在微博上,事件被演绎成w被y粉丝anti,那此时这个事件对两者的影响就完全反过来了,对w毫无负面影响,而对y有很大伤害,我们将描述此影响的向量记为$v_{weibo}=\begin{pmatrix}1\\0\end{pmatrix}$. 然而在知乎上,资本摄入地相对较少,事件的真实程度得到了较大地还原,但失真仍然存在,我们将经过知乎报道后对两人负面影响的向量定为$v_{zhihu}=\begin{pmatrix}0.2\\0.8\end{pmatrix}$。如此定量的原因在于资本摄入还是存在的,因此y还是受到了一定程度的负面影响,故我将这个影响定量为0.2.

    那么我们现在设想另一极端情况,假设真实发生的事件是w被y粉丝anti,初始的列向量就应当是$v_0'=\begin{pmatrix} 1\\0 \end{pmatrix}$. 那么经过微博传播后这一消息由于资本的控制丝毫不会失真,所以经过微博后列向量依旧是$\begin{pmatrix} 1\\0 \end{pmatrix}$. 对于知乎哪,由于y粉丝群体比较理性,失真极小,但仍不可避免。故将经过知乎后的负面影响列向量定为$\begin{pmatrix} 0.95\\0.05 \end{pmatrix}$。

    那对于一个比较“中庸”的情况,比方说真实事件对两者的负面影响相近,我们用列向量$v_0''=\begin{pmatrix} 0.6\\0.4 \end{pmatrix}$表示。由于这个列向量可以拆分成$\begin{pmatrix} 0.6\\0.4 \end{pmatrix}=0.6\times\begin{pmatrix} 1\\0 \end{pmatrix}+0.4\times\begin{pmatrix} 0\\1 \end{pmatrix}$, 而等号右边的两个列向量$\begin{pmatrix} 1\\0 \end{pmatrix}$和$\begin{pmatrix} 0\\1 \end{pmatrix}$恰好是我们前述的两种极端情况,我们已经知道它们经过微博和知乎后的演化结果。这是极好的,而实际上只要知道这两种极端情况的演化结果,我们就可以推演出任意初始列向量(任意中庸情况)的最终演化结果,当然这一结论依赖于下述假设。

   假设:此中庸事件的演化结果是0.6倍的真实事件为$\begin{pmatrix} 1\\0 \end{pmatrix}$的演化结果,与0.4倍的真实事件为$\begin{pmatrix} 0\\1 \end{pmatrix}$的演化结果的。这个假设实际上是将此信息传播的模型选择为线性系统,计算最终演化结果的规则我将其命名为线性相加规则。也许这个表述有点抽象,我们来看看具体到微博和知乎上这个中庸原始事件的演化结果。

   对于微博,这个结果就是0.6倍的$\begin{pmatrix} 1\\0 \end{pmatrix}$(真实事件为$\begin{pmatrix} 1\\0 \end{pmatrix}$的演化结果)与 0.4倍的$\begin{pmatrix} 1\\0 \end{pmatrix}$(真实事件为$\begin{pmatrix} 0\\1 \end{pmatrix}$的演化结果)的和。也就是经过微博后这个事件的负面影响列向量为$v_{weibo}''=0.6\times\begin{pmatrix} 1\\0 \end{pmatrix}+0.4\times \begin{pmatrix} 1\\0 \end{pmatrix}=\begin{pmatrix} 1\\0 \end{pmatrix}$. 即事件经过微博报导后产生的效果为对y负面影响极大,对w无丝毫负面影响,报导严重失真。类似地,对于知乎,中庸事件的演化结果为$v_{zhihu}''=0.6\times\begin{pmatrix} 0.95\\0.05 \end{pmatrix}+0.4\times \begin{pmatrix} 0.2\\0.8 \end{pmatrix}=\begin{pmatrix} 0.65\\0.35 \end{pmatrix}$. 即经过知乎后,对w的负面影响稍有减弱,对y的负面影响稍有增加,总体比较接近原始发生的真实事件

    上述的中庸事件$\begin{pmatrix} 0.6\\0.4 \end{pmatrix}$只是一例,那么对于一般的初始事件,我们依旧可以使用线性相加规则计算出该事件的演化结果。那么如何用一个更加直观的运算表述这个线性相加的规则哪?这就要用到矩阵了。

   

二、 矩阵

 

       矩阵描述的是一个向量到令一个向量的映射关系。用人话说,就是给你一个初始事件对应的列向量,我用矩阵作用一下这个列向量,产生的结果就是这个事件经过媒体报道后的列向量。也许你接触的矩阵定义是将一个个数字填满各行各列的数字阵列,这也没错,这个定义实际上是基于视觉的。那么我们如何写出一个视觉化的用数字组成的矩阵哪?请允许我先告诉你如何写,再告诉你为什么这样写。

       由于真实事件对应的列向量是二维的,即列向量中只有两个数字(对y的负面影响程度和对w的负面影响程度),我们把媒体平台对应的矩阵的列数定为2,与初始列向量维数相同。同时,由于演化后的列向量同样是二维的,我们把媒体平台对应的矩阵行数定为2,与演化后的列向量维数相同。那么,一般地,如果初始列向量维数为$n$,那么矩阵的列数就是$n$; 如果演化后的列向量维数为$m$,那么矩阵的行数就是$m$. 这样,描述整个演化过程的矩阵就是$m$行$n$列。那么对于前述的y和w事件,矩阵就应当是2行2列,因为初始列向量和演化后列向量维数均为2.

      那么这两行两列总计四个数字应当怎么填充哪?由于我们选择列向量讨论,填充方式也将是一列一列填充。我们将$\begin{pmatrix} 1\\0 \end{pmatrix}$作为初始列向量(w被y粉丝anti)时的演化结果填在第一列,将$\begin{pmatrix} 0\\1 \end{pmatrix}$作为初始列向量(y被w粉丝anti)的演化结果填在第二列。具体来讲,微博平台对应的矩阵就是$\begin{pmatrix} 1&1\\0&0\\ \end{pmatrix}$,知乎平台对应的矩阵为$\begin{pmatrix} 0.95&0.2\\0.05&0.8\\ \end{pmatrix}$. 你可能不明白为什么这么写,因为我还没有告诉你运算规则,也就是为什么这个矩阵作用在一个给定的初始列向量就可以得到经过媒体报导后对应的列向量。

      一般的教科书上喜欢如下定义这个运算规则:对于演化后的列向量的第$n$个数字,它是矩阵第$n$行组成的行向量与初始列向量的内积,也就是对应元素的乘积再求和。这听起来不像人话,我们还是看例子。以知乎为例,设初始列向量为$\begin{pmatrix} 0.6\\0.4 \end{pmatrix}$,演化后列向量的第一个数字为矩阵第一行$\begin{pmatrix}0.95&0.2\\ \end{pmatrix}$与初始列向量的对应元素乘积再求和(内积),即$0.6\times 0.95+0.4\times0.2=0.65$. 同理,演化后列向量的第二个数字为矩阵第二行$\begin{pmatrix}0.05&0.8\\ \end{pmatrix}$与初始列向量的内积,即$0.6\times0.05+0.4\times0.8=0.35$. 因此演化后的列向量为$\begin{pmatrix}0.65\\0.35 \end{pmatrix}$. 这与前述用线性相加规则导出的结果一致,实际上矩阵就是线性相加规则的具体代数实现

      至此,我们学会了什么是向量,什么是矩阵,怎么将矩阵作用于向量生成一个新的向量。那么我们能不能再将矩阵作用于这个新生成的向量哪?答案是肯定的。就好像并非所有人都能拿到第一手资讯,大部分媒体所做的是将其他媒体的资讯重新加工。这里资讯就对应向量,媒体报导的作用就是矩阵作用于向量,产生的新资讯就是新生成的向量。我们还是以y和w事件为例,初始的真实事件的信息对应列向量$v_0$, 经过媒体1报导后,该列向量变为$v_1=A\circ v_0$, 这里$A$是媒体1对应的矩阵,$\circ$表示矩阵作用于向量。那么媒体2以媒体1报导后的信息为初始信息来加工生成新的资讯的过程,对应于$v_2=B\circ v_1=B\circ(A\circ v_0)$, 这里$B$是媒体2对应的矩阵。那么我们能否直接用一个矩阵描述从$v_0$到$v_2$的过程哪,也就是将媒体2产生的信息理解为一个媒体C作用在初始的真实信息上而产生哪?如果可以,我们有$v_2=C\circ v_0$. 联立上述关于$v_2$和$v_0$的两个关系式,我们可以得到$C=B\circ A$, 注意$\circ$现在连结的是两个矩阵,这个运算也被称为矩阵乘法,将在下节重点讨论。

 

三、矩阵的乘法

 

      如前所述,矩阵乘法出现在两个媒体对一讯息以链式结构先后报导的情形下。为了讲述方便,我们令这两个媒体分别是微博和知乎,即$A$对应微博的矩阵$\begin{pmatrix} 1&1\\0&0\\ \end{pmatrix}$,$B$对应知乎的矩阵$\begin{pmatrix} 0.95&0.2\\0.05&0.8\\ \end{pmatrix}$。如果我们让微博先对讯息$\begin{pmatrix}0.6\\0.4\end{pmatrix}$报导,之后知乎再对微博产生的结果$\begin{pmatrix}1\\0\end{pmatrix}$报导,最终产生的列向量为$\begin{pmatrix}0.95\\0.05\end{pmatrix}$. 但如果知乎先报导,之后微博再对知乎报导的结果$\begin{pmatrix}0.65\\0.35\end{pmatrix}$报导,最终产生的结果将是$\begin{pmatrix}1\\0\end{pmatrix}$。如此看来,我们发现最终的讯息与媒体报导的先后顺序有关,这是符合常识的。在数学上,这意味着$A\circ B\neq B\circ A$,也就是矩阵的乘法不可交换。我在上一篇文章表述了量子观念的核心:代数体系的乘法不可交换。那么矩阵正好满足此特点,而事实上量子力学的代数体系也的确是建立在矩阵上,因此我称矩阵为量子世界的数字

      最后我想阐述矩阵乘法的运算规则。这里我仅说怎么算,不阐述为什么这么算,但请记住如此计算的原因同样是线性相加规则。如果$C=A\circ B$, 那么$C$的第$m$行第$n$列的数字是$A$的第$m$行的行向量和$B$的第$n$列的列向量的内积。同样以微博知乎为例。$C$的第一行第一列就是$A$的第一行的行向量$\begin{pmatrix}1&1\\ \end{pmatrix}$和$B$的第一列的列向量$\begin{pmatrix}0.95\\0.05\end{pmatrix}$的内积, 即$1\times0.95+1\times0.05=1$. $C$的第一行第二列是$A$的第一行的行向量$\begin{pmatrix}1&1\\ \end{pmatrix}$和$B$的第二列的列向量$\begin{pmatrix}0.2\\0.8\end{pmatrix}$的内积, 即$1\times0.2+1\times0.8=1$. 同理我们可以算出$C=A\circ B=\begin{pmatrix}1&1\\ 0&0\\ \end{pmatrix}=A$。由此可以看出微博的“强大“,不管知乎前面怎么报导,只要一经过微博报导,之后产生的报导结果就与前面的知乎毫无关系!那如果微博先报导哪?$D=B\circ A=\begin{pmatrix}0.95&0.95\\ 0.05&0.05\\ \end{pmatrix}$. 可以看出$C\neq D$,即再一次验证了矩阵乘法的不可交换

 

四、 总结

 

      我尝试着用比较浅显的语言将矩阵介绍给大家,因为它十分重要。它是量子世界的数字,是量子观念关于乘法不可交换的代数体系的具体实现。而上篇文章末尾我提出了两个有待于解决的问题,这两个问题都是关于测量的。现在我们懂了什么是矩阵,我来试着将这两个问题与矩阵关联起来。

  1、 实验仪器中指针所指的示数永远是实数。但以矩阵力学为例,如果用矩阵表征物质的状态,那么如何将矩阵与观测结果的实数联系起来?

         量子世界的数字是矩阵,而矩阵是一个个数字组成的阵列。但实验仪器终究是存在于经典世界的,即那里的数字就是我们日常所说的数字,实数。那么我们如何将量子世界的矩阵(包含不少于一个的数字)对应到经典世界实验仪器告诉我们的那个唯一的数字哪?我先在这里说出答案,讲解将在下篇文章进行。量子世界的矩阵都是方阵,即行数和列数相同的矩阵,方阵的维数就是行数或列数。对于一个$n$维方阵,它有$n$个本征值,每个本征值都是一个经典世界中的数字,它对应实验仪器上可能出现的数字。

 

  2、实验仪器的指针对同样的系统并非每次测量后指示的结果相同。

      这里我同样先说出答案,讲解留在下篇文章。实验仪器可能显示的数字是矩阵的本征值,因为一个矩阵有多于一个的本征值,所以每次实验的结果将是这些本征值的其中之一,但这种说法并不能排除实验结果集中在某个本征值的可能性。那么问题的答案在于某些量子世界的系统可以用向量描述,这个向量中的数字决定了每个本征值出现的几率,也就是不同实验结果的几率。这听起来很不友善,我将在下篇文章中详细说明。

 

五、 答疑

  

  1、 不知道能不能先科普一下现在物理学前沿的分类,从大学物理开始。最近在了解凝聚态物理,但是总感觉知识很零散,没有一个体系。

    物理学前沿我比较俗气地默认为诺贝儿奖会搬的方向,从最近20多年的情况,主要是四大领域的工作:凝聚态(condensed matter physics)、高能物理(high energy physics)、原子分子光物理(atomic, molecular and optical physics )、 天体物理(astrophysics).

              凝聚态物理非常大,我不是做凝聚态的,但凝聚态的物理工作者在整个物理圈占据了半壁江山。我所知道的现在的热点是与拓扑和几何相关的量子霍尔效应、拓扑绝缘体和超导。

 

  2、“那么现在问题的核心就转变为我们该用哪一套代数体系去描述物理系统。而实际上,量子理念的革新必源于代数体系的革新。” 问题:量子理念的革新与几何学是否有关系?方便时可介绍一下。

    量子理念与几何学的联系我不清楚。但几何是现在物理学研究的核心,一般情况下在讨论几何问题时同样是用代数语言研究几何,俗称"代数几何".

 

  3、“对于经典力学体系,也就是没有被量子观念"洗脑"过的物理体系,用来表示物理量的代数体系就是一个个实数,相互作用也不过是对于这些实数的运算。” 问题:“力”、“速度”和“加速度”这些物理量除了大小之外还有方向,表示它们的不是复数吗? 

    在物理里,有大小和方向的量是矢量,而矢量的每个分量仍然是实数。复数可以看成由两个实数组成,往往用实部表述物理量。引入复数在经典世界更多时候是为了解决问题的方便,但在量子世界复数涉及到的相位与几何和拓扑有关,是现代物理研究的前沿。

 

  4、“实验仪器中指针所指的示数永远是实数。” 问题:“指针”意味着对单一数量的测量。如何理解某些实验仪器可以同时给出大小和方向测量结果的复数特征?

    那这种指针指示的是矢量或者广义地说是张量。对于经典世界,实验结果对应的张量的数域仍然是实数。

 

  5、老哥我可以拥有character table和molecular orbital的quantum part吗[失望][失望][失望]没学懂

     我不是做这个方向的,但我可以试着讲一讲。预计在讲完量子力学框架之后讲述一些量子力学的应用,这两部分我不知道适不适合科普,如果我想好一种适合科普的方式讲解的话,我是一定不会放过的。

 

posted on 2019-03-30 11:31  皮冥酷  阅读(766)  评论(0编辑  收藏  举报

导航