给3blue1brown上的线性代数的本质做些注解

普通大学里学习的线性代数确实很low
先从我理解的几个概念说说,行列式是什么?特征值和特征向量又是什么,有什么用?

在B站上看了线性代数的本质系列教程,原作是3blue1brown的,个人感觉非常好,非常好,非常好,重要的事情说三遍。
好就好在它是以几何的角度讲解线性代数,没有任何的计算,它的核心就是第三个视频的线性变换在几何上究竟是怎么变的,并且有贼棒的动态视频展示这个过程。
只要明白了这个,整个系列视频就能水到渠成的理解了。
我是自学的线性代数,很多东西都不理解,例如行列式究竟是个什么玩意,为什么会有这个玩意?矩阵乘法为什么那么定义?特征向量跟原矩阵又有什么关系?
不单这些,关于点积和叉积的概念和在解析几何上的应用,也只是停留在相信它是对的,但为什么是那样不知道。
当然这个视频不可能把所有的东西都讲清楚,但是已经给你所有重要模块,你自己再稍稍思考就可以拼出完整图景。
以前只知道矩阵是个二维数表,但其实应该把矩阵看成向量进行线性变换的函数。矩阵的列其实是新的线性坐标系中单位基向量在直角坐标系中的向量值。
注意这里新的坐标系是线性坐标系,坐标轴可以不正交,只要满足可加性和数乘性就可以,像极坐标系就不行。(这里跟数学分析里坐标变换的雅可比行列式是有区别的)
同一个向量在空间A下的坐标是a,在空间B下的坐标是b,那a和b怎么转换呢?
就是找到A下所有的单位基向量在空间B下的对应的向量(c1,c2,c3...),把这些向量看成列向量,这些列向量按坐标顺序从左到右组合成矩阵C=[c1,c2,c3...],那么
b=Ca
这个就是整个视频的核心,怎么证明这个等式成立呢?因为单位基向量的坐标,就是(0,0,...,0,1,0,0,..0)的形式,里面除了一个1,都是0,
它左乘一个矩阵
遵循矩阵的乘法,其他的向量都是基向量线性组合。自然也满足了,这样看线性变换其实挺特殊的。

后面说的点积的解释,非常的精彩,要明白不是很容易,这个真是环环相扣,我一一分解开来。
首先点积是一个向量a到另一个向量b的投影长度乘以向量b的长度,这个大家都知道
可是我们可以将投影看成是一个线性变换,一个多维的向量到一个1维空间的线性变换,这里用上面的结论就是乘以一个矩阵,
只不过这个矩阵是一个非方阵,更精确的说是一个只有1行的矩阵,因为要将一个向量降维到一维空间中,这里假设原来空间的基用单位直角坐标向量。
那这个矩阵的各个列,就是原来空间下的单位基向量在这个一维空间下的坐标,
并且原来空间下的单位向量到这个一维空间的坐标就是这个一维空间的单位向量到原来空间下的投影(2个直角三角形全等),就是这个一维空间单位向量在原来空间下的坐标,这个被作者称为对偶性。
那这个一维空间的向量就是这个一维空间的单位向量乘以向量的模,乘以模后,将这个一维矩阵竖起来,不就是点乘的样子吗,两个向量的各个坐标值的乘积的代数和。
想我以前从平面几何和三角函数的角度证明点积的正确性,都太复杂了,这个证明真是简单明了。
正应了其中一个视频开篇的引用
不以高难度的证明为傲,因为难度高意味着我们还不理解,理想的情况是能够绘出一幅图景,而其中的证明显而易见。

虽然点乘的解释很完美,但是我觉得叉乘的解释不太好,作者默认了行列式的值就是平行六面体的体积,我认为解释叉乘应该从最本质的ijk向量运算规定,应用乘法分配律直接得出,
具体过程可以看百度百科中关于叉乘的定理。
而回想关于行列式的定义,就是通过ijk运算法则得出并推广的,你看3阶行列式里面的逆序数决定的符号,不就是ijk的逆序数吗?
高阶的也一样啊。但是关于3维以上的体积,数值上也是行列式定义的样子,但是我们都没见过3维以上的空间。

这套视频里面最有用的我觉得就是关于特征向量和特征值的解释了。
特征向量就是经线性变换后,与原向量共线的向量(要么方向一致,要么方向相反),叫做对应线性变换的特征向量。特征值就是线性变换后在特征向量的方向上长度扩大了多少倍(可正可负)。
在详细说明特征向量和特征值之前,作者还将矩阵复合乘积做了说明,就是对向量依次左乘矩阵,依次进行线性变换,等于一个单独的线性变换,就是左边的这些矩阵的乘积等到的矩阵。这里自然隐含了矩阵乘积的行列式就是矩阵行列式的乘积,这个看似有点复杂的理论。
视频里特别讲述了矩阵的对角化的几何意义:将特征向量当成新的基,作者称为特征基,转换矩阵就是可以看成在特征基上对向量进行了缩放操作!
缩放的值在各个特征基上就是相应的特征值,在基上的缩放操作可以用对角阵来表示啊,所以一个在当前基(直角坐标系)下的向量的线性变换,就可以看成,将这个向量转换成特征基下的坐标,就是左乘一个单位特征基为列的矩阵,然后再左乘各个特征基下的缩放倍数,也就是一个对角阵,然后再转换回原来的坐标系(直角坐标系),就是左乘一个单位特征基为列组成的矩阵的逆矩阵。你说酷不酷!
将一个矩阵对角化就是将矩阵A转换成 单位特征矩阵^-1 * diag(特征值) * 单位特征矩阵,$P^{-1}diag\Lambda P$,有了这个强力工具在计算矩阵多项式的时候,只需要对diag(特征值)中的特征值求幂就可以,大大简化了计算。
最后一个视频作者将线性代数理论不单可以用在坐标变换上,也可以用到别的满足可加性和数乘性的任何东西上。不说了,你应该好好的,反复的看看这个系列视频。

如果加上线性代数课上的实对称阵和二次型的理论那就全了,不过有了上面的基础,这2个东西不是很难理解。
实对称阵的特征值都是实数,实对称阵的不同特征值的特征向量正交,所以很自然的实对称阵跟一个实对角型合同。

至于二次型,就是一个实对称阵,再看看惯性定理和正定判定就不说了。

视频地址:https://www.bilibili.com/video/av63478477?p=1

posted on 2020-01-19 21:48  litandy  阅读(636)  评论(0编辑  收藏  举报

导航