线性代数的本质(Essense of Linear Algebra)——3Blue1Brown

视频资料:https://www.bilibili.com/video/av6731067

一、向量是什么

  • 物理专业:向量是空间中的箭头,由长度和方向决定
  • 计算机专业:向量是有序的数字列表
  • 数学家:向量可以是任何东西,只要保证向量相加、数字与向量的相乘有意义即可

(1)当在坐标系下以有序多元数组的形式表示向量时,不同位置上的数字代表在相应坐标轴上的投影长度

(2)当把向量视作一种运动时,向量加法可以视为依次进行各个运动,即向量的首尾相连,反映到数值上,就是对应数值项的相加

(3)从几何角度看,向量数乘就是向量的缩放,反映到数值上,就是各个数值项都乘以标量

(4)线性代数的两种基本运算:向量加法和向量数乘

二、线性组合、张成的空间、基

(1)向量:基向量根据坐标值进行缩放并相加的结果  //用数字描述向量时,都依赖于当前采用的基

(2)线性组合(数乘和加法):两个数乘向量的和(二维)  $a\vec{v}+b\vec{w}$  //缩放再相加

注:线性的一种解释——当固定其中一个标量$a$时,让另一个标量$b$自由变化时,组合向量的终点会形成一条直线

(3)向量张成的空间:给定向量所有线性组合向量的集合

(4)线性相关:存在某向量可以表示为其他向量的线性组合 $\vec{u}=a\vec{v}+b\vec{w}$,即此向量落在其他向量张成的空间中,可以移除而不减小张成的空间

(5)线性无关:所有向量都给张成的空间添加新的维度

(6)基:向量空间的一组基是张成该空间的一个线性无关向量集

三、矩阵与线性变换

(1)变换与函数类似,接收输入,生成输出,变换隐含可以用运动的思想进行理解

注:此处变换接收一个向量,并输出一个向量,可以视为将输入向量移动到输出向量

(2)线性变换的特殊之处:变换保持网格线平行等距分布

  • 所有直线在变换后仍然保持为直线,不能有所弯曲
  • 原点位置必须保持固定

(3)线性变换只需要记录基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix}$ 和 $\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix}$ 变换后的位置   

注:线性变换由它对空间基向量的作用完全决定

(4)重要推论:因为线性变换网格线平行且等距分布,所以变换前后向量关于基向量的线性组合保持不变!

假设原始向量为$\begin{bmatrix}x \\ y\end{bmatrix}$,当基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix}$和 $\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix}$变为$\hat{i}=\begin{bmatrix}1 \\ -2\end{bmatrix}$和 $\hat{j}=\begin{bmatrix}3 \\ 0\end{bmatrix}$时,原始向量变为:

$$\begin{bmatrix}x \\ y\end{bmatrix} \rightarrow x\begin{bmatrix}1 \\ -2\end{bmatrix}+y\begin{bmatrix}3 \\ 0\end{bmatrix}=\begin{bmatrix}1x+3y \\ -2x+0y\end{bmatrix}=\begin{bmatrix}\color{red}1 & \color{red}3\\ \color{red}-\color{red}2 & \color{red}0\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}$$

可以看出,二维线性变换仅由四个数字完全确定,而这四个数字对应于基向量变换后的坐标

因此,可以看出矩阵就是对线性变换的一种描述,其中不同列表示不同基向量变换后的结果;矩阵的乘法视为变换后基向量的线性组合  //矩阵向量乘法用于计算线性变换作用于给定向量的结果

$$\begin{bmatrix}\color{red}a & \color{blue}b\\ \color{red}c & \color{blue}d\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}=x\begin{bmatrix}\color{red}a \\ \color{red}c \end{bmatrix}+y\begin{bmatrix} \color{blue}b\\  \color{blue}d\end{bmatrix}=\begin{bmatrix}{\color{red}ax }+\color{blue}by\\ {\color{red}cx}+\color{blue}dy\end{bmatrix}$$

注:矩阵代表对空间的一种特定线性变换

四、 矩阵乘法与线性变换复合

(1)矩阵乘法的几何意义:两个线性变换相继作用的合成  //独立变换的“复合变换”

(2)追踪基向量的变化:

$$\begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}\color{blue}e & \color{blue}f\\ \color{blue}g & \color{blue}h\end{bmatrix}=\begin{bmatrix}ae+bg & af+bh\\ ce+dg& cf+dh\end{bmatrix}$$

基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix} \rightarrow \begin{bmatrix}e \\ g\end{bmatrix} \rightarrow \begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}e \\ g\end{bmatrix}=\begin{bmatrix}ae+bg\\ ce+dg\end{bmatrix}$

基向量$\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix} \rightarrow \begin{bmatrix}f \\ h\end{bmatrix} \rightarrow \begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}f\\ h\end{bmatrix}=\begin{bmatrix}af+bh\\ cf+dh\end{bmatrix}$

(3)矩阵乘法不符合交换律,但满足结合律

附注1——三维空间中的线性变换:追踪三维基向量的变化  //三维方阵

五、行列式:线性变换改变面积的比例  //三维为体积的缩放

(1)含义(绝对值)

  • 给定区域面积增大或减小的比例  
  • 空间拉伸或挤压的程度
  • 单位正方形的面积变化比例

(2)矩阵行列式为0:对应变换将空间压缩到更低的维度  //列线性相关

(3)行列式的正负号:对空间定向orientation的改变,定向发生改变则为负

注:

  • 可根据基向量$\hat{i}$和$\hat{j}$进行考虑,$\hat{j}$位于$\hat{i}$左侧为正,$\hat{j}$位于$\hat{i}$右侧为负
  • 三维空间的定向:右手法则;如果变换后不符合右手法则,符合左手法则,则行列式为负

(4)计算行列式:$$det\left(\begin{bmatrix}a & b\\c & d\end{bmatrix}\right)=ad-bc$$  //二维方阵

 六、逆矩阵、列空间与零空间

(1)求解常系数线性方程组 $A\vec{x}=\vec{v}$

$$\begin{array}{c} 2x+5y+3z=-3\\4x+0y+8z=0\\1x+3y+0z=2\\\end{array} \rightarrow \begin{bmatrix}2 & 5 & 3\\4 & 0 & 8\\ 1 & 3 & 0\end{bmatrix} \begin{bmatrix}x\\y\\z\end{bmatrix} = \begin{bmatrix}-3\\0\\2\end{bmatrix}$$

方程$A\vec{x}=\vec{v}$的几何含义:寻找向量$\vec{x}$,使得其经过变换$A$后得到向量$\vec{v}$

(2)行列式$det(A)\neq 0$时  //唯一解

有且仅有一个向量满足该变换$\vec{x}=A^{-1}\vec{v}$

此时存在逆变换$A^{-1}$,满足$A^{-1}A=I$(恒等变换) 

(3)行列式$det(A)=0$时

  • 有解的条件:向量$\vec{v}$位于变换后的低维空间内  //列空间

(4)列空间:变换后的基向量(矩阵的列)所能张成的空间 $A\vec{x}$  //解决“何时存在解”

  • 一定包含零向量

(5)秩rank:变换后的空间的维数  //列空间的维数

  • 满秩full rank:秩与列数相等;列空间的维数与输入空间的维数相等
  • 对于满秩矩阵而言,只有零向量在变换后仍落在原点处
  • 对于非满秩矩阵,存在多个向量变换后落在原点

(6)矩阵的零空间(核kernel):变换后落在原点的向量$\vec{x}$集合,即满足$A\vec{x}=\vec{0}$  //解决“解是什么样的”

附注2——非方阵

(1)$m\times n$矩阵:将$n$维向量变换为$m$维向量  //$m\neq n$时,基向量的维度发生变化

(2)矩阵的列数表明基向量的个数(输入空间的维数),矩阵的行数表明变换后输出空间的维数

 七、点积与对偶性  //点积:高维输入,一维输出

(1)$\vec{v}\cdot\vec{w}$标准定义:同维向量对应坐标项相乘后,求和

(2)$\vec{v}\cdot\vec{w}$几何解释:$\vec{v}$在$\vec{w}$方向上的投影长度和$\vec{w}$长度的乘积  //同向为正,反向为负,垂直为0

注:投影的对称性——点积的结果与顺序无关 $\vec{v}\vec{w}=\vec{w}\vec{v}$

(3)实现“高维输入,一维输出”的线性变换需要满足的直观条件:一系列等距分布于一条直线上的点,应用线性变换后,会保持这些点的等距分布特性;若干输出不是等距分布,则变换不是线性的

 注:一维行向量可以视为高维空间向一维空间的变换矩阵,每个元素可以看作基向量的变换结果,如$\begin{bmatrix}2 & 1\end{bmatrix}$

  • 点积与变换的关联:

  • 向量与变换之间的关系(直立和放倒

  • 投影矩阵projection matrix:二维向量到数的线性变换  //空间任意向量经过投影变换的结果为投影矩阵与向量相乘

  如图所示,$\hat{i}$和$\hat{j}$在单位向量$\hat{u}$上的投影值,分别为$u_x$和$u_y$(投影变换矩阵的值);则投影变换与点积的关系如下:

注:任何时候看到一个输出空间为一维数轴的线性变换,空间中会存在唯一的向量$v$与之相关,所以应用变换和与向量$v$做点积是一样的(对偶性duality)

  • 向量 $\Leftrightarrow$ 对应的线性变换  //向量是线性变换的物质载体
  • 多维空间到一维空间的线性变换 $\Leftrightarrow$ 多维空间的某个特定向量  //应用线性变换和与这个向量点乘等价

总结:

  • 点积是理解投影的有利几何工具,并便于检验两个向量的指向是否相同
  • 两个向量点乘:将其中一个向量转换为线性变换

 八、叉积

1. 标准介绍

(1)二维叉积(等价于行列式):

$\overrightarrow{v}\times\overrightarrow{w}$ = 构成的平行四边形的面积 * 方向($\overrightarrow{v}$在$\overrightarrow{w}$右侧为正,否则为负)  //乘积顺序有影响

注:

  • 判断方向的方法,记住横轴单位向量$\hat{i}$与纵轴单位向量$\hat{j}$的叉积$\hat{i}\times\hat{j}$为正  //基向量的顺序就是定向的基础
  • 面积的求法:将向量作为列构成矩阵(与将$\hat{i}$和$\hat{j}$分别移至$\overrightarrow{v}$和$\overrightarrow{w}$的线性变换相对应),矩阵行列式的绝对值即为面积  //作为行也可以,因为转置不改变行列式的值

(2)三维叉积:通过两个三维向量生成一个新的三维向量    $\overrightarrow{v}\times\overrightarrow{w}=\overrightarrow{p}$

  • 生成的三维向量:长度为平行四边形的面积,方向垂直于平行四边形,且符合右手法则

2. 以线性变换的眼光看叉积

(1)线性变换和对偶向量

(2)理解叉积的计算公式和几何含义之间的关系

  • 定义三维空间到数轴的函数:输入任意向量$(x, y, z)$计算与$\overrightarrow{v}$和$\overrightarrow{w}$确定的平行六面体的体积(考虑方向)

  注:根据行列式的性质可以证明该函数是线性的

  • 寻找对偶向量$\overrightarrow{p}$:线性变换$\Rightarrow$矩阵乘法$\Rightarrow$向量点积

  注:寻找向量$\overrightarrow{p}$,满足与向量$(x,y,z)$点乘时,所得结果为右侧$3\times 3$矩阵的行列式

$$\Downarrow$$

  注:计算公式角度

  • 向量$\overrightarrow{p}$点积的几何意义:
  • 六边体体积计算两种思考方式
  1. 线性函数对于给定向量的作用为:将向量投影到垂直于$\overrightarrow{v}$和$\overrightarrow{w}$的直线上,然后将投影长度与$\overrightarrow{v}$和$\overrightarrow{w}$张成的平行四边形的面积相乘  //对行列式的解释
  2. 等价于:垂直于$\overrightarrow{v}$和$\overrightarrow{w}$且长度为平行四边形面积的向量与向量$(x,y,z)$进行点乘  //对对偶向量点乘的解释

  注:几何意义角度

 九、基变换

(1)不同基向量(坐标系)下的坐标表示

注:当坐标均为$\begin{bmatrix}-1 \\ 2\end{bmatrix}$时,基向量的不同会引起在同一坐标系进行表示时的坐标变化

(2)基变换:矩阵代表基向量的变换

(3)基变换图示

  • 基变换矩阵(描述基变量的变化

  • 正变换

  • 逆变换

(4)如何利用标准坐标系描述新基下的线性变换

注:先将新基下的向量转化为标准坐标系表示——>在标准坐标系下进行变换——>将坐标重新变换回新基下的坐标

 

注:表达式$\color{red}{A^{-1}MA}$暗示了一种数学上的转移作用,中间的矩阵$M$代表了一种标准坐标系下的常见变换,外侧的两个矩阵则代表着不同坐标系的视角转化(转移作用),相应的矩阵乘积结果仍然代表着同一个变换,但是从其他人(新坐标系)的角度来看的

十、特征向量与特征值

(1)特征向量:矩阵变换对它的作用仅仅是拉伸或者压缩,如同一个标量  //特征向量留在自身张成的空间里(留在直线上,不发生旋转

(2)特征值:衡量特征向量在变换中拉伸或者压缩比例的因子

(3)对于三维旋转而言,旋转矩阵的特征向量代表了该旋转的旋转轴(不发生变化)  //旋转矩阵的特征值为1(保持向量长度不变)

(4)理解线性变换作用的两种方式

  • 将矩阵列视为变换后的基向量  //依赖于所选特定坐标系
  • 利用特征向量和特征值  //不依赖于坐标系

(5)求解特征向量、特征值

注:当且仅当矩阵$A-\lambda I$代表的变换将空间压缩到更低的维度时,才会存在非零向量$\vec{v}$,使得和矩阵的乘积为零,也就是矩阵的行列式需要为零

(6)二维线性变换不一定有特征向量:如逆时针旋转90度$\begin{bmatrix}0 & -1 \\ 1 & 0\end{bmatrix}$使得每个向量都发生旋转(离开其张成的空间),此时求解行列式为零得不到实数解,表明没有特征向量

注:与虚数$i$相乘在复平面中表现为90度旋转(与$i$是上述旋转变换的特征值有关联);特征值出现复数的情况一般对应于变换中的某种旋转

(7)剪切变换矩阵$\begin{bmatrix}1 & 0 \\ 1 & 1\end{bmatrix}$的所有特征向量都位于$x$轴上,特征值为1

注:可能出现只有一个特征值,但是特征向量不止在一条直线上,如$\begin{bmatrix}2 & 0 \\ 0 & 2\end{bmatrix}$的唯一特征值为2,但是平面内每个向量都是特征向量

(8)特征基eigenbasis:一组特征向量作为基向量构成的集合

  • 对角矩阵的所有基向量都是特征向量,矩阵的对角元为相应的特征值  //对角矩阵仅仅让基向量与某个特征值相乘

  • 当基向量不是特征向量时,可以通过基变换,将坐标系转换为由特征向量作为基向量(特征向量足够多,能够张成全空间

  注:同一个变换在新基(特征向量)$\begin{bmatrix}1 & 0 \\ -1 & 1\end{bmatrix}$下表示为对角矩阵,且对角线元素为特征值

十一、抽象向量空间  //类似向量的事物合集,如箭头、一组数、函数等

(1)向量——>函数

  • 可加性

  • 成比例性

注:可加性和成比例性的直观解释——网格线保持平行且等距分布

  • 线性变换(矩阵)和线性算子(求导)之间的对应关系

  • 向量空间必须满足的八条公理

(2)全体多项式空间的基函数basis functions为:$b_0(x)=1, b_1(x)=x, b_2(x)=x^2, b_3(x)=x^3, \cdots$;

对每个基函数求导,并将结果作为矩阵列,可得函数的求导变换矩阵$\frac{d}{dx}$

(3)普适的代价

 

posted @ 2019-03-10 21:08  从头再来,不要慌  阅读(5617)  评论(0编辑  收藏  举报