线性方程组和矩阵
第一章 线性方程组和矩阵
同济大学(线性代数)
第一节 矩阵的概念及运算
[课前导读]
线性方程组的求解是线性代数要研究的重要问题之一,而矩阵是求解线性方程组的核心工具.另一方面,矩阵理论在自然科学、工程技术、经济管理等领域中有着广泛的应用,是一些实际问题得以解决的基本工具.这一节我们通过线性方程组和矩阵的关系引出矩阵的定义,并给出矩阵的运算及运算性质.在正式学习矩阵之前,需要读者了解线性方程组的相关知识.
一、矩阵的定义
由\(m\)个方程\(n\)个未知量\(x_1,x_2,...,x_n\)构成的线性(即:一次)方程组可以表示为
在线性方程组中,未知量用什么字母表示无关紧要,重要的是方程组中未知量的个数以及未知量的系数和常数项.也就是说,线性方程组(1-1)由常数\(a_{ij}(i=1,2,…,m;j=1,2,…,n)\)和\(b_i(i=1,2,…,m)\)完全确定,所以可以用一个\(m×(n+1)\)个数排成的\(m\)行\(n+1\)列的数表
表示线性方程组(1-1).这个数表的第\(j(j=1,2,…,n)\)列表示未知量\(x_j(j=1,2,…,n)\)前的系数,第\(i(i=1,2,…,m)\)行表示线性方程组(1-1)中的第\(i(i=1,2,…,m)\)个方程,这个数表反映了线性方程组(1-1)的全部信息.反之,任意给定一个\(m\)行\(n+1\)列的数表,可以通过这个数表写出一个线性方程组.因此,线性方程组与这样的数表之间有了一个对应关系.
定义1 矩阵定义
\(m×n\)个数\(a_{ij}(i=1,2,{\cdots},m;j=1,2,{\cdots},n)\)排成的\(m\)行\(n\)列的数表
称为一个\(m×n\)矩阵,简记为\((a_{ij})\),有时为了强调矩阵的行数和列数,也记为\((a_{ij})_{m×n}\).数\(a_{ij}\)位于矩阵\((a_{ij})\)的第\(i\)行第\(j\)列,称为矩阵的\((i,j)\)元素,其中\(i\)称为元素\(a_{ij}\)的行标,\(j\)称为元素\((_{ij}\)的列标.
一般地,常用英文大写字母\(A,B,…\)或字母\(α,β,γ,…\)表示矩阵,如\(A=(a_{ij}), B=(b_{ij}),A_{m×n},B_{m×n}\)等.
元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵.本书中的矩阵除特别指明外,都是指实矩阵.
\(1×1\)的矩阵
\(1×n\)的矩阵, 称为行矩阵,也称为\(n\)维行向量.
\(n×1\)的矩阵, 称为列矩阵,也称为\(n\)维列向量.
所有元素都是零的\(m×n\)的矩阵称为零矩阵,记为\(O_{m×n}\), 或简记为\(O\).
\(n×n\)的矩阵称为方阵. 元素\(a_{ii}(i=1, 2, {\cdots}, n)\)所在的位置称为\(n\)阶方阵的主对角线.
上三角
下三角
对角阵, \(diag(a_1, a_2, {\cdots}, a_n)\)
单位矩阵\(E_n\)或\(E\)
定义2 矩阵相等
两个矩阵的行数相等、列数也相等,则称这两个矩阵为同型矩阵.如果两个同型矩阵\(A=(a_{ij})_{m×n}\)和\(B=(b_{ij})_{m×n}\)中所有对应位置的元素都相等,即\(a_{ij}=b_{ij}\),其中\(i=1, 2, {\cdots}, m; j=1, 2, {\cdots}, n\)则称矩阵\(A\)和\(B\)相等,记为\(A=B\).
二、矩阵的线性运算
定义3 矩阵加法\(A+B\)
设\(A=(a_{ij})_{m×n}\)和\(B=(b_{ij})_{m×n}\)是两个同型矩阵,则矩阵\(A\)与\(B\)的和记为\(A+B\),规定
同型矩阵的加法就是两个矩阵对应位置上元素的加法,由此易知矩阵的加法满足如下的运算规律:设\(A,B,C\)是任意三个\(m×n\)矩阵,则
- 交换律:\(A+B=B+A\);
- 结合律:\((A+B)+C=A+(B+C)\);
- \(A+O_{m×n}=O_{m×n}+A=A\).
对于矩阵\(A=(a_{ij})_{m×n}\),称矩阵\((-a_{ij})_{m×n}\)为矩阵\(A\)的负矩阵,记为\(-A\).显然,\(A+(-A)=O_{m×n}\).由此可以定义矩阵\(A=(a_{ij})_{m×n}\)和\(B=(b_{ij})_{m×n}\)的减法为\(A-B=A+(-B)=(a_{ij}-b_{ij})_{m×n}\).
定义4 矩阵数乘\(kA\)
用一个数\(k\)乘矩阵\(A=(a_{ij})_{m×n}\)的所有元素得到的矩阵\((k\cdot a_{ij})_{m×n}\)称为矩阵的数乘,记为\(kA\)或者\(Ak\),即\(kA=Ak=(k\cdot a_{ij})_{m×n}\).
如果\(k,l\)是任意两个数,\(A,B\)是任意两个\(m×n\)矩阵,则矩阵的数乘运算满足:
- \(k(A+B)=kA+kB\);
- \((k+l)A=kA+lA\);
- \((kl)A=k(lA)=l(kA)\);
- \(1A=A\);
- \((-1)A=-A\);
- \(0A=O_{m×n}\).
矩阵的加法和矩阵的数乘统称为矩阵的线性运算。
三、矩阵的乘法
定义5 矩阵乘法\(A_{m×p}B_{p×n}\)
设矩阵\(A=(a_{ij})_{m×p}\),矩阵\(B=(b_{ij})_{p×n}\),定义矩阵A与B的乘积是矩阵\(C=(c_{ij})_{m×n}\),其中矩阵\(C=(c_{ij})\)的第\(i\)行第\(j\)列元素\(c_{ij}\)是矩阵\(A\)的第\(i\)行元素\(a_{i1},a_{i2},…,a_{ip}\)与矩阵\(B\)的第\(j\)列相应元素\(b_{1j},b_{2j},…,b_{pj}\)的乘积之和,即
必须注意:只有当第一个矩阵(左边的矩阵)的列数与第二个矩阵(右边的矩阵)的行数相等时,两个矩阵才能相乘.
1 矩阵乘法不满足交换律,即在一般情况下,\(AB≠BA\);
2 尽管矩阵\(A\)与\(B\)满足\(AB=O\),但是得不出\(A=O\)或\(B=O\)的结论.
但是,矩阵乘法仍满足下列运算规律(假设运算都是可行的).
- 结合律:\((AB)C=A(BC)\).
- 矩阵乘法对矩阵加法的分配律:\(A(B+C)=AB+AC,(A+B)C=AC+BC\).
- \((kA)B=A(kB)=k(AB)\).
- \(E_mA_{m×n}=A_{m×n}E_n=A_{m×n}\).
- \(O_{m×s}A_{s×n}=O_{m×n};A_{m×s}O_{s×n}=O_{m×n}\)
对于方阵有
并且规定:对非零方阵\(A\),有\(A^0=E\).
方阵的方幂满足以下运算规律(这里k,l均为非负整数):
四、矩阵的转置
定义6 矩阵转置\(A_{m×n}\)
设\(A=\begin{pmatrix} {a_{11}}&{a_{12}}&{\cdots}&{a_{1n}}\\ {a_{21}}&{a_{22}}&{\cdots}&{a_{2n}}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {a_{m1}}&{a_{m2}}&{\cdots}&{a_{mn}}\\ \end{pmatrix}\),把矩阵\(A\)的行换成同充数的列,得到\(n×m\)矩阵称为矩阵\(A\)的转置矩阵,记为\(A^T\),即
矩阵的转置满足下面的运算规律(这里\(k\)为常数,\(A\)与\(B\)为同型矩阵):
- \((A^T)^T=A\);
- \((A+B)^T=A^T+B^T\);
- \((AB)^T=B^TA^T\);
- \((kA)^T=kA^T\).
定义7 对称矩阵,反对称矩阵
\(n\)阶方阵\(A\)如果满足\(A^T=A\),则称\(A\)为对称矩阵,如果满足\(A^T=-A\),则称\(A\)为反对称矩阵.
第二节 分块矩阵
[课前导读]
当矩阵的行数和列数较高时,为了证明或计算的方便,常把矩阵分成若干小块,把每个小块当作“数”来处理,这便是矩阵的分块.这一节我们将讨论矩阵的分块方式和分块矩阵的计算.在学习这一节之前,需要读者熟练掌握矩阵的线性运算、矩阵乘法和矩阵的转置运算.
一、分块矩阵的概念
对于行数和列数较高的矩阵\(A\),运算时常用一些横线和竖线将矩阵\(A\)分划成若干个小矩阵,每一个小矩阵称为\(A\)的子块,以子块为元素的形式上的矩阵称为分块矩阵.
二、分块矩阵的运算
分块矩阵的运算规则与普通矩阵的运算规则相类似,不同的计算方式,分块的原则不同,下面分情况讨论.
(1)分块矩阵加(减)运算:设\(A、B\)都是\(m×n\)矩阵,对两个矩阵的行和列采用相同的分块方式,不妨设
其中\(A_{ij}\)和\(B_{ij}\)的行数相同、列数相同,则有
(2)分块矩阵的数乘运算:
(3)分块矩阵乘法:设\(A_{m×s}、B_{s×n}\),要求矩阵\(A\)的列分块方式与矩阵\(B\)的行分块方式保持一致,而对矩阵A的行分块方式及矩阵B的列分块方式没有任何要求和限制.不妨设
其中\(A_{i1},A_{i2},…,A_{ik}\)的列数分别等于\(B_{1j},B_{2j},…,B_{kj}\)的行数, 则
其中
(4)分块矩阵的转置:设\(A=\begin{pmatrix} {A_{11}}&{A_{12}}&{\cdots}&{A_{1k}}\\ {A_{21}}&{A_{22}}&{\cdots}&{A_{2k}}\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {A_{t1}}&{A_{t2}}&{\cdots}&{A_{tk}}\\ \end{pmatrix}\), 则\(A^T=\begin{pmatrix} {A_{11}}^T&{A_{21}}^T&{\cdots}&{A_{t1}}^T\\ {A_{12}}^T&{A_{22}}^T&{\cdots}&{A_{t2}}^T\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {A_{1k}}^T&{A_{2k}}^T&{\cdots}&{A_{tk}}^T\\ \end{pmatrix}\)
(5)分块对角阵:设\(A\)是\(n\)阶方阵,若\(A\)的分块矩阵只有在主对角线上有非零子块,且这些非零子块都是方阵,而其余子块都是零矩阵,即
其中\(A_i(i=1,2,…,t)\)都是方阵,这样的分块阵称为分块对角阵.
第三节 线性方程组与矩阵的初等变换
[课前导读]
本节通过高斯消元法解线性方程组,引入矩阵的初等行变换,并给出矩阵的初等变换、阶梯形矩阵、行最简形矩阵、矩阵等价等概念.最后,我们利用矩阵的初等行变换来求解线性方程组.在学习本节之前,需要读者回忆消元法解线性方程组的相关知识.当然,正文中会详细给出如何用消元法解线性方程组.
一、矩阵的初等变换
定义1 下面三种变换称为矩阵的初等行变换
(1)交换矩阵的某两行,我们用\(r_i↔r_j\)表示交换矩阵的第\(i,j\)两行;
(2)矩阵的某一行乘以非零数,用\(kr_i\)表示矩阵的第\(i\)行元素乘以非零数\(k\);
(3)将矩阵的某一行的倍数加到另一行,用\(r_j+kr_i\)表示将矩阵第\(i\)行的\(k\)倍加到第\(j\)行.
将上面定义中的“行”换成“列”(记号由“\(r\)”换成“\(c\)”),就得到了矩阵的初等列变换的定义.
矩阵的初等行变换和初等列变换统称为矩阵的初等变换.
对于一般的矩阵,我们有下面的结论.
定理
- 任意一个\(m×n\)矩阵总可以经过若干次初等行变换化为行阶梯形矩阵;
- 任意一个\(m×n\)矩阵总可以经过若干次初等行变换化为行最简形矩阵;
- 任意一个\(m×n\)矩阵总可以经过若干次初等变换(行变换和列变换)化为它的标准形\(F=\begin{pmatrix} E_r&O\\ O&O \end{pmatrix}\)其中\(r\)为行阶梯形矩阵中非零行的行数.
定义2 矩阵等价
若矩阵\(A\)经过有限次初等行(列)变换化为矩阵\(B\),则称矩阵\(A\)与矩阵\(B\)行(列)等价;若矩阵\(A\)经过有限次初等变换化为矩阵\(B\),则称矩阵\(A\)与矩阵\(B\)等价.
我们用\(A\stackrel{r}{\sim}B\)表示矩阵\(A\)与矩阵\(B\)行等价,用\(A\stackrel{c}{\sim}B\)表示矩阵\(A\)与矩阵\(B\)列等价,用\(A\sim B\)表示矩阵\(A\)与矩阵\(B\)等价.注意:矩阵间的行(列)等价以及矩阵间的等价是一个等价关系,即满足
- 自反性:任意矩阵A与自身等价.
- 对称性:若矩阵A与矩阵B等价,则矩阵B与矩阵A等价.
- 传递性:若矩阵A与矩阵B等价,矩阵B与矩阵C等价,则矩阵A与矩阵C等价.
等价关系是数学中一个十分重要的概念.等价的对象具有某种共性,这在以后可以得到具体的体现.
第四节 初等矩阵与矩阵的逆矩阵
[课前导读]
我们知道,在实数的运算中有逆的概念,即如果\(ab=ba=1\),则有\(b=a^{-1}\)和\(a=b^{-1}\).本节我们也在矩阵的运算中引入类似的概念,即方阵的逆,并给出逆矩阵的性质和求法.在学习本节前,需要读者熟悉矩阵的初等变换.
一、方阵的逆矩阵
1. 逆矩阵的定义
定义1 设\(A\)为\(n\)阶方阵,如果存在\(n\)阶方阵\(B\)使得
其中,\(E\)为\(n\)阶单位方阵,则称矩阵\(A\)是可逆的,矩阵\(B\)称为\(A\)的逆矩阵;否则称\(A\)是不可逆的.
如果矩阵\(A\)可逆,则\(A\)的逆矩阵一定是唯一的.这是因为,若矩阵\(B、C\)都满足
由于矩阵乘法满足结合律,于是$$C=CE=C(AB)=(CA)B=EB=B$$
所以\(A\)的逆矩阵一定是唯一的.\(A\)的逆矩阵记为\(A^{-1}\).
2. 逆矩阵的性质
- 若\(A\)可逆, 则\(A^{-1}\)也可逆, 并且\((A^{-1})^{-1}=A\);
- 若矩阵\(A_1,A_s,\cdots,A_s\)可逆, 则它们的乘积\(A_1A_s\cdots A_s\)也可逆, 并且\((A_1A_s\cdots A_s)^{-1}=A_s^{-1}\cdots A_2^{-1}A_1^{-1}\);
- 若\(A\)可逆, 则\(A^T\)也可逆, 并且\((A^T)^{-1}=(A^{-1})^T\);
- 若\(A\)可逆并且数\(k\neq0\), 则\(kA\)也可逆, 并且\((kA)^{-1}=k^{-1}A^{-1}\);
二、初等矩阵
定义2 对\(n\)阶单位矩阵\(E\)实施一次初等变换得到的矩阵称为\(n\)阶初等矩阵.由于初等变换有三种,对\(n\)阶单位矩阵\(E\)实施一次初等变换得到的初等矩阵也有三类.
- 交换单位阵\(E\)的第\(i\)行和第\(j\)行,或交换\(E\)的第\(i\)列和第\(j\)列,得到的初等矩阵记为\(E(i,j)\),即
- 用非零数\(k\)乘单位阵\(E\)的第\(i\)行或第\(i\)列,得到的初等矩阵记为\(E(i(k))\),即
- 将单位阵\(E\)的第\(i\)行乘以非零数\(k\)加到第\(j\)行(或将单位阵\(E\)的第\(j\)列乘以非零数\(k\)加到第\(i\)列),得到的初等矩阵记为\(E(i(k), j)\),即
关于初等变换与初等矩阵的关系,我们有下面的结论.
命题1 初等矩阵都是可逆的,并且初等矩阵的逆矩阵仍为同一类型的初等矩阵,即
证明 直接计算可得
\(E(i,j)E(i,j)=E\)
\(E(i(k))E(i(\dfrac1k))=E(i(\dfrac1k))E(i(k))=E\)
\(E(i(k),j)E(i(-k),j)=E(i(-k),j)E(i(k),j)=E\)
命题2 设\(A\)是一个\(m×n\)矩阵,对\(A\)施行一次初等行变换,相当于在\(A\)的左边乘以相应的\(m\)阶初等矩阵;对\(A\)施行一次初等列变换,相当于在\(A\)的右边乘以相应的\(n\)阶初等矩阵.
三、初等矩阵与逆矩阵的应用
首先,我们利用初等矩阵和初等变换给出一个方阵可逆的判别条件.
定理1 下面命题互相等价:
(1)\(n\)阶方阵\(A\)可逆;
(2)方阵\(A\)行等价于\(n\)阶单位矩阵\(E\);
(3)方阵\(A\)可表示为一些初等方阵的乘积.
证明 为了证明的方便,我们采取(1)⇒(2)⇒(3)⇒(1)的方式来证明.
(1)⇒(2):由本章第三节的定理可知,方阵\(A\)经过若干次初等行变换可化为行最简形矩阵\(R\).再由命题2可知,这相当于存在若干个初等矩阵\(P_1,P_2,…,P_s\),使得\(P_s…P_2P_1A=R\). 由于初等矩阵都可逆,若\(A\)可逆,则根据逆矩阵的性质知\(P_s…P_2P_1A=R\)可逆,从而行最简形矩阵\(R\)没有全零行,这迫使\(R=E\),即\(P_s…P_2P_1A=E\),所以方阵\(A\)行等价于\(n\)阶单位矩阵\(E\).
(2)⇒(3):若方阵\(A\)行等价于\(n\)阶单位矩阵\(E\),则存在若干个初等矩阵\(P_1,P_2,…,P_s\),使得\(P_s…P_2P_1A=E\).由于初等矩阵都可逆且其逆矩阵仍为初等矩阵,记\(P_1,P_2,…,P_s\)的逆矩阵分别为\(P_1^{-1},P_2^{-1},…,P_s^{-1}\), 于是\(P_1^{-1}P_2^{-1}…P_s^{-1}(P_s…P_2P_1A)=P_1^{-1}P_2^{-1}…P_s^{-1}E\), 即\(A=P_1^{-1}P_2^{-1}…P_s^{-1}\)
即也就是说,\(A\)可表示为初等方阵的乘积.
(3)⇒(1):设方阵\(A=P_1^{-1}P_2^{-1}…P_s^{-1}\),其中\(P_1^{-1},P_2^{-1},…,P_s^{-1}\)均为初等矩阵,由于初等矩阵均可逆,于是它们的乘积\(A=P_1^{-1}P_2^{-1}…P_s^{-1}\)也可逆.
由定理1的证明可知,若\(n\)阶方阵\(A\)可逆,则存在一个可逆阵\(P=P_s…P_2P_1\),使得\(PA=E\),于是$$A{-1}=(P_1P_2{-1}…P_s)^{-1}=P_s…P_2P_1=P$$
构造一个分块矩阵\((A|E)\),做分块矩阵乘法:
上式等价于对分块矩阵\((A|E)\)实施了若干次初等行变换,当\(A\)变成\(E\)时,\(E\)就变成了\(A^{-1}\).所以,定理1给出了判别矩阵\(A\)是否可逆,并在可逆时求\(A^{-1}\)的一种方法:
(1)首先构造分块矩阵\((A|E)\);
(2)对矩阵\((A|E)\)实施初等行变换,将\((A|E)\)化为行最简形矩阵;
(3)如果\(A\)不能行等价于\(E\),则矩阵\(A\)不可逆;若\(A\)能行等价于\(E\),则\(A\)可逆,且\(E\)就行等价于\(A^{-1}\).