线性代数学习笔记(一)
矩阵乘向量 的 两种几何解释
row picture
以3X3矩阵为例,可理解为:矩阵A的每一行与向量相乘,分别得到一个平面(如:\( a_{11}x_1 + a_{12}x_2 + a_{13}x_3 = b_1 \)),方程的解是三个平面的交点。
\( A\mathbf{x}=\begin{bmatrix}a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\end{bmatrix}\begin{bmatrix}x_{1}\\ x_{2}\\ x_{3}\end{bmatrix}=\begin{bmatrix}a_{11}x_1+a_{12}x_2+a_{13}x_3\\ a_{21}x_1+a_{22}x_2+a_{23}x_3\\ a_{31}x_1+a_{32}x_2+a_{33}x_3\end{bmatrix}= \begin{bmatrix}b_1\\ b_2\\ b_3\end{bmatrix}=\mathbf{b} \)
column picture
这种方法更好理解一些。将矩阵按列拆分,几何上,每一列就是一个向量,方程是矩阵每一列向量的线性组合。当向量之间不独立时(如第三个向量在前两个向量决定的平面上),方程得到的 b 无法填满所有的三维空间(而只能填满那个平面)。
\( A\mathbf{x}=\begin{bmatrix}a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\end{bmatrix}\begin{bmatrix}x_{1}\\ x_{2}\\ x_{3}\end{bmatrix}=x_1\begin{bmatrix}a_{11}\\ a_{21}\\ a_{31}\end{bmatrix}+x_2\begin{bmatrix}a_{12}\\ a_{22}\\ a_{32}\end{bmatrix}+x_3\begin{bmatrix}a_{13}\\ a_{23}\\ a_{33}\end{bmatrix} \)
“独立”
按照column picture来理解,将A分为 u, v, w 三个列向量:
如果 u, v, w 相互独立,矩阵A为 可逆矩阵, Ax=0 有唯一解。(看做三个向量组合,若独立,各个分量的解x只能为0)
如果 u, v, w 并不独立,矩阵A为 奇异矩阵, Ax=0 有无数解。(若三个向量组合之后回到原点,则同时放大固定倍数后仍回原点)
为什么叫做“奇异矩阵”(singular matrix):
根据Quora的解释,“奇异”意味着“稀少”、“不寻常”,假如我们随机挑三个列向量u,v,w,那么他们非常可能是相互独立的(因为在一条线上的概率很小),所以不可逆矩阵的情况很稀少、不寻常,因此称之为奇异矩阵。
矩阵乘矩阵 的 四种解释
与矩阵乘向量相类似,分为行与列两种方式。以AxB=C为例:
C的每一行 都是 B的行的加权
将A和B都按照行来切分,C的第一行 看做 A的第一行各个分量*B相对应的行向量 的和,即:
\( \begin{bmatrix}c_{11}&c_{12}& c_{13}\end{bmatrix}=a_{11}*\begin{bmatrix}b_{11}&b_{12}& b_{13}\end{bmatrix}+a_{12}*\begin{bmatrix}b_{21}&b_{22}& b_{23}\end{bmatrix}+a_{13}*\begin{bmatrix}b_{31}&b_{32}& b_{33}\end{bmatrix} \)
按照Strang的解释:Each row of A acts on B to give a row of C.
C的每一列 都是 A的列的加权
将A和B都按照列来切分:
\( \begin{bmatrix}c_{11}\\ c_{21}\\ c_{31}\end{bmatrix}=\begin{bmatrix}a_{11}\\ a_{21}\\a_{31}\end{bmatrix}*b_{11}+\begin{bmatrix}a_{12}\\ a_{22}\\a_{32}\end{bmatrix}*b_{12}+\begin{bmatrix}a_{13}\\ a_{23}\\a_{33}\end{bmatrix}*b_{13} \)
A acts on each column of B to give a column of C.
C的每个单元cij 是 A的第i行 乘上 B的第j列
按行理解和按列理解均可,例如按行理解,取的是B的行中某个分量的加权。
分块相乘
将A按照列拆分成块,B按照行拆分成块,C看做A与B的分块乘积之和。
\( \begin{bmatrix}|& &| \\ \mathbf{a_1} & ... &\mathbf{a_n} \\ | & &| \end{bmatrix}\begin{bmatrix}- & \mathbf{b_1} &- \\ & ... & \\ - & \mathbf{b_n} & -\end{bmatrix}=\begin{bmatrix}\\\mathbf{a_1b_1+...+a_nb_n}\\\\\end{bmatrix} \)