线性代数的本质（Essense of Linear Algebra）——3Blue1Brown

视频资料：https://www.bilibili.com/video/av6731067

一、向量是什么

物理专业：向量是空间中的箭头，由长度和方向决定
计算机专业：向量是有序的数字列表
数学家：向量可以是任何东西，只要保证向量相加、数字与向量的相乘有意义即可

（1）当在坐标系下以有序多元数组的形式表示向量时，不同位置上的数字代表在相应坐标轴上的投影长度

（2）当把向量视作一种运动时，向量加法可以视为依次进行各个运动，即向量的首尾相连，反映到数值上，就是对应数值项的相加

（3）从几何角度看，向量数乘就是向量的缩放，反映到数值上，就是各个数值项都乘以标量

（4）线性代数的两种基本运算：向量加法和向量数乘

二、线性组合、张成的空间、基

（1）向量：基向量根据坐标值进行缩放并相加的结果　　//用数字描述向量时，都依赖于当前采用的基

（2）线性组合（数乘和加法）：两个数乘向量的和（二维）　　$a\vec{v}+b\vec{w}$　　//缩放再相加

注：线性的一种解释——当固定其中一个标量$a$时，让另一个标量$b$自由变化时，组合向量的终点会形成一条直线

（3）向量张成的空间：给定向量所有线性组合向量的集合

（4）线性相关：存在某向量可以表示为其他向量的线性组合 $\vec{u}=a\vec{v}+b\vec{w}$，即此向量落在其他向量张成的空间中，可以移除而不减小张成的空间

（5）线性无关：所有向量都给张成的空间添加新的维度

（6）基：向量空间的一组基是张成该空间的一个线性无关向量集

三、矩阵与线性变换

（1）变换与函数类似，接收输入，生成输出，变换隐含可以用运动的思想进行理解

注：此处变换接收一个向量，并输出一个向量，可以视为将输入向量移动到输出向量

（2）线性变换的特殊之处：变换保持网格线平行且等距分布

所有直线在变换后仍然保持为直线，不能有所弯曲
原点位置必须保持固定

（3）线性变换只需要记录基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix}$ 和 $\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix}$ 变换后的位置　　　

注：线性变换由它对空间基向量的作用完全决定

（4）重要推论：因为线性变换网格线平行且等距分布，所以变换前后向量关于基向量的线性组合保持不变！

假设原始向量为$\begin{bmatrix}x \\ y\end{bmatrix}$,当基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix}$和 $\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix}$变为$\hat{i}=\begin{bmatrix}1 \\ -2\end{bmatrix}$和 $\hat{j}=\begin{bmatrix}3 \\ 0\end{bmatrix}$时，原始向量变为：

$$\begin{bmatrix}x \\ y\end{bmatrix} \rightarrow x\begin{bmatrix}1 \\ -2\end{bmatrix}+y\begin{bmatrix}3 \\ 0\end{bmatrix}=\begin{bmatrix}1x+3y \\ -2x+0y\end{bmatrix}=\begin{bmatrix}\color{red}1 & \color{red}3\\ \color{red}-\color{red}2 & \color{red}0\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}$$

可以看出，二维线性变换仅由四个数字完全确定，而这四个数字对应于基向量变换后的坐标

因此，可以看出矩阵就是对线性变换的一种描述，其中不同列表示不同基向量变换后的结果；矩阵的乘法视为变换后基向量的线性组合　　//矩阵向量乘法用于计算线性变换作用于给定向量的结果

$$\begin{bmatrix}\color{red}a & \color{blue}b\\ \color{red}c & \color{blue}d\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}=x\begin{bmatrix}\color{red}a \\ \color{red}c \end{bmatrix}+y\begin{bmatrix} \color{blue}b\\ \color{blue}d\end{bmatrix}=\begin{bmatrix}{\color{red}ax }+\color{blue}by\\ {\color{red}cx}+\color{blue}dy\end{bmatrix}$$

注：矩阵代表对空间的一种特定线性变换

四、矩阵乘法与线性变换复合

（1）矩阵乘法的几何意义：两个线性变换相继作用的合成　　//独立变换的“复合变换”

（2）追踪基向量的变化：

$$\begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}\color{blue}e & \color{blue}f\\ \color{blue}g & \color{blue}h\end{bmatrix}=\begin{bmatrix}ae+bg & af+bh\\ ce+dg& cf+dh\end{bmatrix}$$

基向量$\hat{i}=\begin{bmatrix}1 \\ 0\end{bmatrix} \rightarrow \begin{bmatrix}e \\ g\end{bmatrix} \rightarrow \begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}e \\ g\end{bmatrix}=\begin{bmatrix}ae+bg\\ ce+dg\end{bmatrix}$

基向量$\hat{j}=\begin{bmatrix}0 \\ 1\end{bmatrix} \rightarrow \begin{bmatrix}f \\ h\end{bmatrix} \rightarrow \begin{bmatrix}\color{red}a & \color{red}b\\ \color{red}c & \color{red}d\end{bmatrix}\begin{bmatrix}f\\ h\end{bmatrix}=\begin{bmatrix}af+bh\\ cf+dh\end{bmatrix}$

（3）矩阵乘法不符合交换律，但满足结合律

附注1——三维空间中的线性变换：追踪三维基向量的变化　　//三维方阵

五、行列式：线性变换改变面积的比例　　//三维为体积的缩放

（1）含义（绝对值）

给定区域面积增大或减小的比例　　
空间拉伸或挤压的程度
单位正方形的面积变化比例

（2）矩阵行列式为0：对应变换将空间压缩到更低的维度　　//列线性相关

（3）行列式的正负号：对空间定向orientation的改变，定向发生改变则为负

注：

可根据基向量$\hat{i}$和$\hat{j}$进行考虑，$\hat{j}$位于$\hat{i}$左侧为正，$\hat{j}$位于$\hat{i}$右侧为负
三维空间的定向：右手法则；如果变换后不符合右手法则，符合左手法则，则行列式为负

（4）计算行列式：$$det\left(\begin{bmatrix}a & b\\c & d\end{bmatrix}\right)=ad-bc$$　　//二维方阵

六、逆矩阵、列空间与零空间

（1）求解常系数线性方程组 $A\vec{x}=\vec{v}$

$$\begin{array}{c} 2x+5y+3z=-3\\4x+0y+8z=0\\1x+3y+0z=2\\\end{array} \rightarrow \begin{bmatrix}2 & 5 & 3\\4 & 0 & 8\\ 1 & 3 & 0\end{bmatrix} \begin{bmatrix}x\\y\\z\end{bmatrix} = \begin{bmatrix}-3\\0\\2\end{bmatrix}$$

方程$A\vec{x}=\vec{v}$的几何含义：寻找向量$\vec{x}$，使得其经过变换$A$后得到向量$\vec{v}$

（2）行列式$det(A)\neq 0$时　　//唯一解

有且仅有一个向量满足该变换$\vec{x}=A^{-1}\vec{v}$

此时存在逆变换$A^{-1}$，满足$A^{-1}A=I$（恒等变换）

（3）行列式$det(A)=0$时

有解的条件：向量$\vec{v}$位于变换后的低维空间内　　//列空间

（4）列空间：变换后的基向量（矩阵的列）所能张成的空间 $A\vec{x}$　　//解决“何时存在解”

一定包含零向量

（5）秩rank：变换后的空间的维数　　//列空间的维数

满秩full rank：秩与列数相等；列空间的维数与输入空间的维数相等
对于满秩矩阵而言，只有零向量在变换后仍落在原点处
对于非满秩矩阵，存在多个向量变换后落在原点

（6）矩阵的零空间（核kernel）：变换后落在原点的向量$\vec{x}$集合，即满足$A\vec{x}=\vec{0}$　　//解决“解是什么样的”

附注2——非方阵

（1）$m\times n$矩阵：将$n$维向量变换为$m$维向量　　//$m\neq n$时，基向量的维度发生变化

（2）矩阵的列数表明基向量的个数（输入空间的维数），矩阵的行数表明变换后输出空间的维数

七、点积与对偶性　　//点积：高维输入，一维输出

（1）$\vec{v}\cdot\vec{w}$标准定义：同维向量对应坐标项相乘后，求和

（2）$\vec{v}\cdot\vec{w}$几何解释：$\vec{v}$在$\vec{w}$方向上的投影长度和$\vec{w}$长度的乘积　　//同向为正，反向为负，垂直为0

注：投影的对称性——点积的结果与顺序无关 $\vec{v}\vec{w}=\vec{w}\vec{v}$

（3）实现“高维输入，一维输出”的线性变换需要满足的直观条件：一系列等距分布于一条直线上的点，应用线性变换后，会保持这些点的等距分布特性；若干输出不是等距分布，则变换不是线性的

注：一维行向量可以视为高维空间向一维空间的变换矩阵，每个元素可以看作基向量的变换结果，如$\begin{bmatrix}2 & 1\end{bmatrix}$

点积与变换的关联：

向量与变换之间的关系（直立和放倒）

投影矩阵projection matrix：二维向量到数的线性变换　　//空间任意向量经过投影变换的结果为投影矩阵与向量相乘

　　如图所示，$\hat{i}$和$\hat{j}$在单位向量$\hat{u}$上的投影值，分别为$u_x$和$u_y$（投影变换矩阵的值）；则投影变换与点积的关系如下：

注：任何时候看到一个输出空间为一维数轴的线性变换，空间中会存在唯一的向量$v$与之相关，所以应用变换和与向量$v$做点积是一样的（对偶性duality）

向量 $\Leftrightarrow$ 对应的线性变换　　//向量是线性变换的物质载体
多维空间到一维空间的线性变换 $\Leftrightarrow$ 多维空间的某个特定向量　　//应用线性变换和与这个向量点乘等价

总结：

点积是理解投影的有利几何工具，并便于检验两个向量的指向是否相同
两个向量点乘：将其中一个向量转换为线性变换

八、叉积

1. 标准介绍

（1）二维叉积（等价于行列式）：

$\overrightarrow{v}\times\overrightarrow{w}$ = 构成的平行四边形的面积 * 方向（$\overrightarrow{v}$在$\overrightarrow{w}$右侧为正，否则为负）　　//乘积顺序有影响

注：

判断方向的方法，记住横轴单位向量$\hat{i}$与纵轴单位向量$\hat{j}$的叉积$\hat{i}\times\hat{j}$为正　　//基向量的顺序就是定向的基础
面积的求法：将向量作为列构成矩阵（与将$\hat{i}$和$\hat{j}$分别移至$\overrightarrow{v}$和$\overrightarrow{w}$的线性变换相对应），矩阵行列式的绝对值即为面积　　//作为行也可以，因为转置不改变行列式的值

（2）三维叉积：通过两个三维向量生成一个新的三维向量 $\overrightarrow{v}\times\overrightarrow{w}=\overrightarrow{p}$

生成的三维向量：长度为平行四边形的面积，方向垂直于平行四边形，且符合右手法则

2. 以线性变换的眼光看叉积

（1）线性变换和对偶向量

（2）理解叉积的计算公式和几何含义之间的关系

定义三维空间到数轴的函数：输入任意向量$(x, y, z)$计算与$\overrightarrow{v}$和$\overrightarrow{w}$确定的平行六面体的体积（考虑方向）

　　注：根据行列式的性质可以证明该函数是线性的

寻找对偶向量$\overrightarrow{p}$：线性变换$\Rightarrow$矩阵乘法$\Rightarrow$向量点积

　　注：寻找向量$\overrightarrow{p}$，满足与向量$(x,y,z)$点乘时，所得结果为右侧$3\times 3$矩阵的行列式

$$\Downarrow$$

　　注：计算公式角度

向量$\overrightarrow{p}$点积的几何意义：
六边体体积计算两种思考方式：

线性函数对于给定向量的作用为：将向量投影到垂直于$\overrightarrow{v}$和$\overrightarrow{w}$的直线上，然后将投影长度与$\overrightarrow{v}$和$\overrightarrow{w}$张成的平行四边形的面积相乘　　//对行列式的解释
等价于：垂直于$\overrightarrow{v}$和$\overrightarrow{w}$且长度为平行四边形面积的向量与向量$(x,y,z)$进行点乘　　//对对偶向量点乘的解释

　　注：几何意义角度

九、基变换

（1）不同基向量（坐标系）下的坐标表示