矩阵的话还是慢慢来,前面的定义和基本运算很显然,看完定义就会,从矩阵乘法开始就难多了。
定义
由\(n\times m\)个数\(a_ij\)排成的\(n\)行\(m\)列的矩阵,记为
\[A=\begin{bmatrix} a_{11} & a_{12} & ··· & a_{1m} \\ a_{21} & a_{22} & ··· & a_{2m} \\ a_{31} & a_{32} & ··· & a_{3m} \\ ··· & ··· & & ··· \\ a_{m1} & a_{m2} & ··· & a_{nm} \\ \end{bmatrix}
\]
这\(n\times m\)个数称为矩阵\(A\)的元素,简称为元。数\(a_{ij}\)位于矩阵\(A\)的第\(i\)行第\(j\)列,称为矩阵\(A\)的\((i,j)\)元,以数\(a_{ij}\)为\((i,j)\)元的矩阵可以记为\(a_{ij}\)或\((a_{ij}){n\times m}\),\(n\times m\)矩阵\(A\)也记作\(A_{nm}\)。
元素是实数的矩阵称为实矩阵;
元素是复数的矩阵称为复矩阵;
行与列都等于\(n\)的矩阵称为\(n\)阶矩阵或\(n\)阶方阵;
\(n\)阶方阵中所有\(i=j\)的元素\(a_{ij}\)组成的斜线称为(主)对角线
所有\(i+j=n+1\)的元素\(a_{ij}\)组成的斜线称为辅对角线。
基本运算:
矩阵的基本运算包括加法,减法,数乘, 共轭和共轭转置等。
加法与减法
对于两个同类型(行列数一样)的矩阵\(A\)和\(B\),加法就是把对应\((i,j)\)元做加法运算 $$\begin{bmatrix}1 & 2 & 3 \3 & 0 &4\end{bmatrix}+\begin{bmatrix}2 & 3 & 3 \4 & 6 &1\end{bmatrix} = \begin{bmatrix}1+2 & 2+3 & 3+3 \3+4 & 0+6 &4+1\end{bmatrix} = \begin{bmatrix}3 & 5 & 6 \7 & 6 &5\end{bmatrix}$$
矩阵加法满足加法交换律和加法结合律
\[A+B=B+A
\]
\[A+(B+C)=(A+B)+C
\]
减法的运算与加法向类似
\[\begin{bmatrix}1 & 2 & 3 \\3 & 0 &4\end{bmatrix}-\begin{bmatrix}2 & 3 & 3 \\4 & 6 &1\end{bmatrix} = \begin{bmatrix}1-2 & 2-3 & 3-3 \\3-4 & 0-6 &4-1\end{bmatrix} = \begin{bmatrix}-1 & -1 & 0 \\-1 & -6 &3\end{bmatrix}
\]
数乘
数乘就是一个数乘一个矩阵,只需要把这个数乘到每一个元\((i,j)\)上
\[2\times \begin{bmatrix}1 & 0 & -2 \\3 & -3 &4\end{bmatrix} = \begin{bmatrix}1 \times 2 & 0\times 2 & -2\times 2 \\3\times 2 & -3\times 2 &4\times 2\end{bmatrix} = \begin{bmatrix}2 & 0 & -4 \\6 & -6 &8\end{bmatrix}
\]
矩阵的数乘运算满足乘法的交换律,结合律,分配率
\[(\lambda \mu)A = \lambda(\mu A)
\]
\[(\lambda+\mu)A=\lambda A+\mu A
\]
\[\lambda(A+B) = \lambda A + \lambda B
\]
乘法的加减法及数乘合称为矩阵的"线性"运算
转置
把矩阵\(A\)的行换成同序数的列得到的新的矩阵称为\(A\)的转置矩阵,这一过程称为矩阵的转置,简单说,就是把\((i,j)\)元的\(i\)和\(j\)换一换,把\(a_{ij}\)变成\(a_{ji}\) $$\begin{bmatrix}1 & 0 & -2 \3 & -3 &4\end{bmatrix}^T=\begin{bmatrix}1 & 3 \ 0 &-3\-2&4\end{bmatrix}$$
矩阵的转置满足以下运算律
\(i\)和\(j\)交换了两次又变回了原来的样子
\[(A^T)^T = A
\]
剩下两个无非是先转再乘和先乘再转的区别,显然
\[(\lambda A)^T = \lambda A^T
\]
\[(AB)^T=A^TB^T
\]
共轭和共轭转置是在复矩阵上的,暂时还不研究
矩阵的乘法运算
上面的还比较简单,但到了矩阵乘法,一切都变了。
定义
两个矩阵的乘法仅当第一个矩阵\(A\)的列数和另一个矩阵B的行数相等时才能定义。如\(A\)是\(m×n\)矩阵和\(B\)是\(n×p\)矩阵,它们的乘积\(C\)是一个\(m×p\)矩阵\(C=(c_{ij})\),它的一个元素: $$c_{i,j} = a_{i,1}b_{1,j}+a_{i,2}b{2,j}+···+a_{i,n}b_{n,j} = \sum_{r=1}^na_{i,r}b_{r,j}$$
并将此乘积记为\(C=AB\) 例如:
\[\begin{bmatrix}1 & 2 & 3 \\3 & 0 &4\end{bmatrix}\times \begin{bmatrix}2 & 3\\1 & 4\\1 & 2\end{bmatrix} $$ $$= \begin{bmatrix}(1\times 2+ 2\times 1+3\times 1) & (1\times 3+2\times 4+3\times 2)\\(3\times 2+0\times 1+4\times 1)& (1\times 3+0\times 4+4\times 2)\end{bmatrix} = \begin{bmatrix}7&17\\10 & 17 \end{bmatrix}
\]
满足结合律,左分配律,右分配律
\[A(BC)=(AB)C
\]
\[(A+B)C=AC+BC
\]
\[C(A+B)=CB+CA
\]
但不满足交换律。
定义说完了,
why?
定义说完了,还是没懂,为什么是这么个规则?
矩阵的本质是线性方程,两者一一对应。
给出一组线性方程
\[\begin{cases}
3x+4y=5\\
2x+3y=3
\end{cases}
\]
矩阵本来就是想为线性方程提供一个简单的表达形式
\[\begin{bmatrix}3&4\\2&3\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}5\\3\end{bmatrix}
\]
这样就差不多能看出矩阵乘法的规则了。
严格些说,对于三组未知数,\(x\),\(y\),\(z\)
\(x\)和\(y\)的关系
\[\begin{cases}
a_{11}x_1+a_{12}x_2=y_1\\
a_{21}x_1+a_{22}x_2=y_2
\end{cases}\]
得到
\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix}
\]
\(x\)和\(z\)的关系
\[\begin{cases}
b_{11}z_1+b_{12}z_2=x_1\\
b_{21}z_1+b_{22}z_2=x_2
\end{cases}\]
得到
\[\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix}\begin{bmatrix}t_1\\t_2\end{bmatrix}=\begin{bmatrix}x_1\\x_2\end{bmatrix}
\]
这样就可以得到\(z\)和\(y\)的关系
\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix}\begin{bmatrix}z_1\\z_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix}
\]
\[\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix} = \begin{bmatrix}y_1\\y_2\end{bmatrix}\div \begin{bmatrix}z_1\\z_2\end{bmatrix}
\]
写到方程中就是
\[\begin{cases}
a_{11}(b_{11}z_1+b_{12}z_2)+a_{12}(b_{21}z_1+b_{22}z_2)=y_1\\
a_{21}(b_{11}z_1+b_{12}z_2)+a_{22}(b_{21}z_1+b_{22}z_2)=y_2
\end{cases}\]
整理一下
\[\begin{cases}
(a_{11}b_{11}+a_{12}b_{21})z_1+(a_{11}b_{12} + a_{12}b_{22})z_2=y_1\\
(a_{21}b_{11}+a_{22}b_{21})z_1+(a_{21}b_{12} + a_{22}b_{22})z_2=y_2
\end{cases}\]
\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}\begin{bmatrix}z_1\\z_2\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix}
\]
\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}=\begin{bmatrix}y_1\\y_2\end{bmatrix}\div \begin{bmatrix}z_1\\z_2\end{bmatrix}
\]
\[==>\begin{bmatrix}a_{11}b_{11}+a_{12}b_{21}&a_{11}b_{12} + a_{12}b_{22}\\a_{21}b_{11}+a_{22}b_{21}&a_{21}b_{12} + a_{22}b_{22}\end{bmatrix}=\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}\begin{bmatrix}b_{11}&b_{12}\\b_{21}&b_{22}\end{bmatrix}
\]
得到矩阵乘法的表达式。