线性代数公式定理一览表

本文内容参考

  1. 科学出版社 王定江主编的《线性代数》
  2. 李永乐主编的2022线性代数辅导讲义

本文中的直观理解并不严谨,仅供参考理解。如理解有误,请帮忙指正

文章纯手打,可能会有较多错误,请阅读时注意

第一章 行列式

第一节 \(n\) 阶行列式

二、\(n\) 阶行列式

1. 全排列与逆序数

定义2:\(n\) 个不同的元素排成一行,称为这 \(n\) 个元素的全排列。

当某两个元素的先后次序与标准次序不同时,就称为有一个逆序。一个排列中所有逆序的和,称为这个排列的逆序数个人补充:序列中 每个数左边比它大的数的个数和 或者 每个数右边比它小的数的个数和。

定理 1:一个排列中的任意两个元素对换,排列改变奇偶性

推论:奇排列变成标准排列的对换次数为奇数次,偶排列变成标准排列的次数为偶数

定义3:设有 \(n^2\) 个数\(a_{ij}(i,j=1,2,\cdots,n)\) 排成 \(n\)\(n\) 列的数表

\[\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \tag{1.10} \]

\[\left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right | =\sum(-1)^ta_{1q_1}a_{2q_2}\cdots a_{nq_n} \tag{1.11} \]

其中,\(\sum\) 表示对 \(1,2,\cdots,n\)\(n\) 个数的所有全排列 \(q_1q_2\cdots q_n\) 求和,即公有 \(n!\) 项求和,\(t\) 表示排列 \(q_1q_2\cdots q_n\) 的逆序数,称式(1.11)是数表(1.10)确定的 \(n\) 阶行列式,记做 \(D_n=det(a_{ij})\)

定理2:\(n\) 阶行列式也可以定义为

\[D=\sum(-1)^ra_{p_11}a_{p_22}\cdots a_{p_nn} \]

其中 \(r\) 表示排列 \(p_1p_2\cdots p_n\) 的逆序数

推论:\(n\) 阶行列式也可以定义为

\[D=\sum(-1)^{r+t}a_{p_1q_1}a_{p_2q_2}\cdots a_{p_nq_n} \]

其中 \(r\) 表示排列 \(p_1p_2\cdots p_n\) 的逆序数,\(t\) 表示排列 \(q_1q_2\cdots q_n\) 的逆序数

第二节 行列式性质与展开定理

一、行列式的性质

设行列式

\[D = \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right | \]

则称它对应的行列式

\[D^T=\left | \begin{matrix} a_{11} & a_{21} & \cdots & a_{n1} \\ a_{12} & a_{22} & \cdots & a_{n2} \\ \vdots & \vdots & & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn} \\ \end{matrix} \right | \]

\(D\)转置行列式。即把行列式 \(D\) 的行与列对应位置的元素互换得到它的转置行列式 \(D^T\)

性质1:行列式与它的转置行列式相等

性质2:行列式两行(列)互换,行列式变号

推论:若行列式有两行(列)元素完全相同,则此行列式等于零。个人补充:即存在两个向量线性相关,无法构成四边形

性质3:行列式某一行(列)的所有元素都乘以同一数 \(k\),等于用数 \(k\) 去乘次行列式个人补充:构成面积的某一条边扩大k倍,面积扩大k倍

推论1:行列式某一行(列)的所有元素的公因子可以提到行列式的符号外面.

推论2:行列式某一行(列)的所有元素全为零,则其值等于零.

推论3:若行列式中有两行(列)的元素对应成比例,则其值等于零。个人补充:即存在两个向量线性相关,无法构成四边形

性质4:若行列式的某一行(列)的元素都是两数之和,例如,第i行的元素都是两数之和

\[D = \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{i1}+a'_{i1} & a_{i2}+a'_{i2} & \cdots & a_{in}+a'_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right | \]

\(D\) 等于下列两个行列式之和,即

\[D = \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{i1} & a_{i2} & \cdots & a_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right |+ \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a'_{i1} & a'_{i2} & \cdots & a'_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right | \]

直观上理解:两个底面相同的立方体重叠放置,体积相加

性质5:把行列式的某一行(列)的各元素乘以同一个数然后加到另一行(列)对应的元素上去,行列式的值不变。

\[D = \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a_{i1} & a_{i2} & \cdots & a_{in} \\ \vdots & \vdots & & \vdots \\ a_{j1} & a_{j2} & \cdots & a_{jn} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right |+\left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a_{i1} + ka_{j1} & a_{i2} + ka_{j2} & \cdots & a_{in} + ka_{jn} \\ \vdots & \vdots & & \vdots \\ a_{j1} & a_{j2} & \cdots & a_{jn} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right | \]

直观上理解:原来的四边形的边

二、行列式按行(列)展开定理

1. 余子式和代数余子式

\(n\) 阶行列式中,把元素 \(a_{ij}\) 所处的第 \(i\) 行和第 \(j\) 列的元素划掉后,剩余的元素按照原来的位置组成的 \(n -1\) 阶行列式称为元素 \(a_{ij}\) 的余子式,记做 \(M_{ij}\) ;记

\[A_{ij}=(-1)^{i+j}M_{ij} \]

称为元素 \(a_{ij}\) 的代数余子式

2. 行列式按行(列)展开定理

引理:\(n\) 阶行列式 \(D\) 的第 \(i\) 行元素除 \(a_{ij}\) 外其余元素都为零,则此行列式等于 \(a_{ij}\) 与其代数余子式的成绩,即\(D=a_{ij}A_{ij}\)

定理3: \(n\) 阶行列式等于它的任一行(列)的各元素与其对应的代数余子式乘积之和,即

\[D=a_{i1}A_{i1} + a_{i2}A_{i2} + \dots +a_{in}A_{in} = \sum_{k=1}^na_{ik}A_{ik}\ \ \ \ (i=1,2,\dots,n) \]

\[D=a_{1j}A_{1j} + a_{2j}A_{2j} + \dots + a_{nj}A_{nj} = \sum_{k=1}^na_{kj}A_{kj} \ \ \ \ (j=1,2,\dots,n)\\ \]

该定理称为行列式按行(列)展开定理。

推论:行列式某一行(列)的元素与另一行(列)的对应元素的代数余子式乘积之和等于零,即

\[a_{i1}A_{j1} + a_{i2}A_{j2} + \dots +a_{in}A_{jn} =0,\ \ \ \ i\neq j \]

\[a_{1i}A_{1j} + a_{2i}A_{2j} + \dots +a_{ni}A_{nj} =0,\ \ \ \ i\neq j \]


范德蒙德(Vandermonde)行列式。(数学归纳法证明)

\[D_n=\left| \begin{matrix} 1 & 1 & \dots & 1\\ x_1 & x_2 & \dots & x_n\\ x_1^2 & x_2^2 & \dots & x_n^2\\ \vdots & \vdots & & \vdots\\ x_1^{n-1} & x_2^{n-1} & \dots & x_n^{n-1}\\ \end{matrix} \right| =\prod_{1 \leq i < j \leq n}(x_j-x_i) \]

拉普拉斯展开式

\[\left| \begin{matrix} A & *\\ 0 & B \end{matrix} \right| = \left| \begin{matrix} A & 0\\ * & B \end{matrix} \right| =|A|\cdot|B|\\ \left| \begin{matrix} 0 & A\\ B & * \end{matrix} \right| = \left| \begin{matrix} * & A\\ B & 0 \end{matrix} \right| =(-1)^{mn}|A|\cdot|B| \]

第三节 克拉默(Cramer)法则

一、克拉默法则

考察 \(n\) 个方程 \(n\) 个未知数的线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{n1}x_1 + a_{n2}x_2 + \dots + a_{nn}x_n = b_n \\ \end{cases}\tag{1.19} \]

定理4(克拉默法则):如果线性方程组(1.19)的系数行列式不等于零,即

\[D = \left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right |\neq0 \]

则线性方程组(1.19)有唯一解

\[x_1=\frac{D_1}{D},x_2=\frac{D_2}{D},\cdots,x_1=\frac{Dn}{D},\tag{1.20} \]

其中\(D_j(j=1,2,\cdots,n)\)是把系数行列式 \(D\) 中第 \(j\) 列的元素用方程组右端的常数项代替后得到的 \(n\) 阶行列式,即

\[D = \left| \begin{matrix} a_{11} & \cdots & a_{1,j-1} & b_1 & a_{1,j+1} & \cdots & a_{1n}\\ \vdots & & \vdots & \vdots & \vdots & & \vdots\\ a_{n1} & \cdots & a_{n,j-1} & b_n & a_{n,j+1} & \cdots & a_{nn}\\ \end{matrix} \right| \]

定理5: 如果线性方程组(1.19)的系数行列式 \(D \neq 0\) ,则方程组(1.19)一定有解,且解是唯一的。

个人补充:行列式不为零→构成行列式的各个向量之间线性无关→向量构成一个维度为n的向量空间→对于非零向量\([b_1,b_2,\cdots,b_n],其在n维向量空间中的位置是唯一的→方程组有唯一解\)

定理5的逆否命题为定理6

定理6: 如果线性方程组(1.19)无解或解不唯一,则它的系数行列式必为零

个人补充:行列式为零→构成行列式的向量存在线性相关→构成维度为\(n-i\)的向量空间→如果与目标向量缺失的维度一致,则有多个解,否则为无解。具体见第三章第三节第二小节下的内容

二、齐次线性方程组

线性方程组(1.19)右端的常数项 \(b_1,b_2,\cdots,b_n\) 不全为零时,线性方程组(1.19)称为非齐次线性方程组,当 \(b_1,b_2,\cdots,b_n\) 全为零时,线性方程组(1.19)称为齐次线性方程组

对于齐次线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = 0 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = 0 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{n1}x_1 + a_{n2}x_2 + \dots + a_{nn}x_n = 0 \\ \end{cases}\tag{1.21} \]

\(x_1=x_2=\cdots=x_n=0\) 一定是它的解,这个解称为齐次线性方程组(1.21)的零解。如果一组不全为零的数是方程组(1.21)的解,则它称为齐次线性方程组(1.21)的非零解

定理7: 如果齐次线性方程组(1.21)的系数行列式 \(D \neq 0\),则齐次线性方程组(1.21)只有零解。

个人补充:行列式不为零→构成行列式的各个向量之间线性无关→向量构成一个维度为n的向量空间→目标向量是零向量,必须各个坐标为零才能构成→方程组只有零解$

定理8: 如果齐次线性方程组(1.21)有非零解,则它的系数行列式为零。

个人补充:行列式为零→构成行列式的向量存在线性相关→构成维度为\(n-i\)的向量空间→对于缺失的维度,可以取任意值,因为其最后都会被压缩→方程有非零解

第二章 矩阵及其运算

第一节 矩阵及其有关概念

一、矩阵

定义 1:\(m\times n\) 个数 \(a_{ij}(i=1,2,\cdots,m;j=1,2,\cdots,n)\)排成的 \(m\)\(n\) 列的数表

\[\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{matrix} \]

称为 \(m\)\(n\) 列矩阵,简称 \(m \times n\) 矩阵,通常用大写黑体字母表示,记作

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} \tag{2.1} \]

\(a_{ij}\) 为矩阵 \(A\) 的第 \(i\) 行第 \(j\) 列元素,一个 \(m \times n\) 矩阵 \(A\) 也可以简记为 \(A=(a_{ij})_{m\times n}\)\(A=(a_{ij})\),为了更清楚的表明矩阵的行、列数,有时也写作 \(A_{m\times n}\)

对于一般非齐次线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \\ \end{cases}\tag{2.2} \]

其系数可以构成一个 \(m\)\(n\) 列的矩阵

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} \tag{2.3} \]

称为线性方程组(2.2)的系数矩阵,而称

\[\overline{A}=\begin{pmatrix} \begin{array} {cccc:c} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & & \vdots & \vdots\\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \\ \end{array} \end{pmatrix} \tag{2.4} \]

为线性方程组(2.2)增广矩阵,一个线性方程组对应唯一的系数矩阵和增广矩阵,它和增广矩阵是一一对应的

二、特殊矩阵

1. 零矩阵

若一个矩阵的所有元素都为零,则称这个矩阵为零矩阵,记为 \(O\)\(O_{m\times n}\).

2. 行矩阵与列矩阵

只有一行元素的矩阵称为行矩阵,如 \(A=(a_1,a_2,\cdots,a_n)\)

只有一列元素的矩阵称为列矩阵,如 \(B=\begin{pmatrix}b_1\\b_2\\\vdots\\b_m\end{pmatrix}\)

3.方阵

行数等于列数的矩阵称为方阵,例如\(A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix}\)\(n\times n\)方阵,,也,为 \(n\) 阶方阵\(n\) 阶矩阵,记作 \(A=(a_{ij})_n\) ,元素 \(a_{11},a_{22},\cdots,a_{nn}\) 所在的直线称为方阵的主对角线。

一阶方阵 \((a)\) 就是元素 \(a\) ,不改变方阵 \(A=(a_{ij})_n\) 中元素排列顺序所构造的 \(n\) 阶行列式

\[\left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right| \]

称为方阵 \(A\) 的行列式,记为 \(|A|\)\(det\ A\).

4.上三角形矩阵

主对角线以下的元素全为零的 \(n\) 阶方阵 \(A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ 0 & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & a_{nn} \\ \end{pmatrix}\)称为上三角形矩阵

5. 下三角形矩阵

主对角线以上的元素全为零的 \(n\) 阶方阵 \(A=\begin{pmatrix} a_{11} & 0 & \cdots & 0 \\ a_{21} & a_{22} & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix}\)称为下三角形矩阵

6.对角矩阵

主对角线以外的元素都为零的 \(n\) 阶方阵\(A=\begin{pmatrix} a_{11} & & & \\ & a_{22} & & \\ & & \ddots & \\ & & & a_{nn} \\ \end{pmatrix}\) 称为对角矩阵,对角矩阵既是上三角矩阵又是下三角矩阵,即当 \(i\neq j\) 时,\(a_{ij}=0\)

特别地,主对角元都相等的 \(n\) 阶对角阵 \(A=\begin{pmatrix} \lambda & & & \\ & \lambda & & \\ & & \lambda & \\ & & & \lambda \\ \end{pmatrix}\)称为数量矩阵,而主对角元都是 \(1\)\(n\) 阶数量矩阵 称为 \(A=\begin{pmatrix} 1 & & & \\ & 1 & & \\ & & 1 & \\ & & & 1 \\ \end{pmatrix}n\) 阶单位矩阵,记作 \(E_n\)\(E\)

三、矩阵的相等

若两个矩阵的行数相等,列数也相等时,称它们是同型矩阵

定义2:\(A=(a_{ij})\)\(B=(b_{ij})\) 是同型矩阵,且对应元素相等,即

\[a_{ij}=b_{ij},\ \ i=1,2,\cdots,m;\ \ j=1,2,\cdots,n \]

则称矩阵 \(A\) 与矩阵 \(B\) 相等,记作 \(A=B\).

第二节 矩阵的基本运算

一、矩阵的加法

定义3:\(A=(a_{ij})_{m\times n},B=(b_{ij})_{m\times n}\)是同型矩阵,规定 \(A\)\(B\) 的相加的和矩阵为

\[A+B=\begin{pmatrix} a_{11}+b_{11} & a_{12}+b_{12} & \cdots & a_{1n}+b_{1n} \\ a_{21}+b_{21} & a_{22}+b_{22} & \cdots & a_{2n}+b_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1}+b_{m1} & a_{m2}+b_{m2} & \cdots & a_{mn}+b_{mn} \\ \end{pmatrix} \tag{2.5} \]

根据定义容易验证矩阵的加法满足以下运算规律(设 \(A,B,C\) 都是同型矩阵):

  1. \(A+B=B+A\)
  2. \((A+B)+C=A+(B+C)\)

\(A = (a_{ij})_{m\times n}\) ,记 \(-A = (-a_{ij})_{m\times n}\)\(-A\) 称为矩阵 \(A\)负矩阵,显然有\(A+(-A)=0\)。由此可以定义矩阵的减法为 \(A-B=A+(-B)\).

二、数乘矩阵

定义4: 设矩阵 \(A=(a_{ij})_{m\times n}\)\(\lambda\) 是一个数,规定数 \(\lambda\) 与矩阵 \(A\) 的乘积为:

\[\lambda A=A\lambda=(\lambda a_{ij})=\begin{pmatrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n} \\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n} \\ \vdots & \vdots & & \vdots \\ \lambda a_{n1} & \lambda a_{n2} & \cdots & \lambda a_{nn} \\ \end{pmatrix} \]

\(\lambda A\)简称数乘矩阵,根据定义容易验证矩阵的数乘满足一下运算性质(设 \(A,B\) 都是同型矩阵;\(\lambda,\mu\) 为数):

  1. $\lambda A=A\lambda $
  2. \((\lambda \mu)A=\lambda (\mu A)=\mu(\lambda A)\)
  3. \(\lambda (A+B)=\lambda A+\lambda B;(\lambda + \mu)A=\lambda A+\mu A\)
  4. \(0A=O,\lambda O=O\)
  5. \(A\)\(n\) 阶矩阵,\(\lambda\) 为实数,则 \(|\lambda A|=\lambda^n |A|\)

矩阵加法与数乘运算合起来统称为矩阵的线性运算。若 \(A=(a_{ij})_{m\times n},B=(b_{ij})_{m \times n}\)\(\lambda,\mu\) 为数,则 \(A,B\) 线性运算出矩阵\(\mu A+\lambda B=(\mu a_{ij}+\lambda b_{ij})_{m\times n}\)

三、矩阵乘法

定义5: 设矩阵 \(A=(a_{ij})_{m\times s},B=(b_{ij})_{s \times n}\),若记

\[c_{ij}=a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{is}b_{sj}=\sum_{k=1}^s a_{ik}b_{kj}(i=1,2,\cdots,m;j=1,2,\cdots,n) \]

则以 \(c_{ij}\) 为元素构成的矩阵 \(C=(c_{ij})_{m \times n}\) 称为矩阵 \(A\) 和矩阵 \(B\)乘积,记作 \(C=AB\)

矩阵的乘积一般不满足交换律,而且两个非零矩阵的乘积,可能是零矩阵,因此矩阵的乘法需要注意:

  1. 任意两个矩阵未必可乘
  2. 交换律一般不成立,即一般来说 \(AB \neq BA\),但若 \(AB=BA\) 成立,则称矩阵 \(A\)\(B\) 可交换
  3. 消去律一般不成立,即由 \(AB=O\),不能推出 \(A=O\)\(B=O\) ,因此由 \(AB= AC\)\(A \neq O\) 不能推出 \(B=C\) ,这是因为 \(AB - AC= A(B-C)=O\) 不能推出 \(B-C=O\).

但矩阵的乘法仍满足以下运算性质(假设运算都可行):

  1. \((AB)C=A(BC)\)

  2. \(A(B+C)=AB+AC;(B+C)A=BA+CA\)

  3. \(\lambda (AB)=(\lambda A)B=A(\lambda B)\)

  4. \(AO=O,OA=O\)

  5. \(A_{m \times n}E_n=A_{m \times n},E_m A_{m \times n} = A_{m \times n}\),其中矩阵 \(A=(a_{ij})_{m \times n}\)\(E\) 为单位矩阵

  6. \(A,B\) 都是 \(n\) 阶方阵,则\(|AB|=|A||B|\)

    个人补充:\(A\) 将面积缩放|A|倍,\(B\) 将面积缩放|B|倍,\(AB\) 先将面积缩放|A|倍,再缩放 |B|倍,所以|AB|=|A||B|

设有线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \\ \end{cases}\tag{2.6} \]

记矩阵

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix}, X=\begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix}, b=\begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_n \end{pmatrix} \]

\(A\) 即为线性方程组(2.6)的系数矩阵,称 \(X\) 为未知数向量(变元),\(b\) 为常数向量,而由

\[AX=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix}= \begin{pmatrix} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n\\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n\\ \vdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n\\ \end{pmatrix} \]

可知,方程组(2.6)可以表示为

\[AX=b\tag{2.7} \]

式(2.7)称为线性方程组(2.6)的矩阵表达式

四、方阵的乘幂

定义6:\(A\)\(n\) 阶方阵,定义

\[A^0=E,A^1=A,A^2=AA,\cdots,A^{k+1}=A^kA \]

由定义可知,只有方阵才有乘幂运算,容易验证方阵乘幂有以下运算性质(\(k,l\) 为正整数):

  1. \(A^{k+l}=A^kA^l\)
  2. \((A^k)^l=A^{kl}\)
  3. \(|A^k|=|A|^k\)

五、矩阵的转置

定义7:\(m \times n\) 矩阵 \(A=(a_{ij})_{m\times n}\) 的行(列)依次转换为列(行)得到的 \(n \times m\) 矩阵 \((a_{ji})_{n \times m}\) 称为矩阵 \(A\)转置矩阵,记作 \(A^T\)

容易验证矩阵的转置满足以下运算性质:

  1. \((\lambda A)^T=\lambda A^T\)
  2. \((A\pm B)^T=A^T \pm B^T\)
  3. \((AB)^T=B^TA^T\)
  4. \(A\)\(n\) 阶方阵,则 \(|A^T|=|A|\)
  5. \((A^T)^T = A\)

定义8:\(A\)\(n\) 阶方阵,如果 \(A^T=A\),则称 \(A\)对称矩阵,如果 \(A^T=-A\),则称 \(A\) 为反对称矩阵

第三节 逆矩阵

一、伴随矩阵

定义9:\(A=(a_{ij})_{n\times n}\)\(n\) 阶矩阵,称 \(n\) 阶矩阵

\[\begin{pmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \\ \end{pmatrix} \]

\(A\) 的伴随矩阵,记为 \(A^*\),其中 \(A_{ij}\)\(|A|\) 中元素 \(a_{ij}\) 的代数余子式

注: \(A*\) 中第 \(i\) 行元素是矩阵 \(A\) 的行列式 \(|A|\) 中第 \(i\) 列对应元素的代数余子式。

定理1:\(A*\)\(n\) 阶方阵 \(A\) 的伴随矩阵,则

\[AA^*=A^*A=|A|E \tag{2.8} \]

二、逆矩阵及其性质

1. 逆矩阵

定义10:\(A\)\(n\) 阶方阵,若存在 \(n\) 阶方阵 \(B\),使得

\[AB=BA=E \tag{2.9} \]

则称矩阵 \(A\) 可逆(或称 \(A\) 是可逆矩阵),称 \(B\)\(A\) 的逆矩阵,记为 \(A^{-1}\),即 \(B=A^{-1}\),若不存在 \(n\) 阶方阵 \(B\) 满足式(2.9),则称矩阵A 不可逆。

定理2: 若方阵 \(A\) 可逆,则 \(A\) 的逆矩阵是唯一的。

2. 矩阵可逆的条件

定理3: \(n\) 阶矩阵 \(A\) 可逆的充分必要条件是 \(|A| \neq 0\) 且当 \(A\) 可逆时,有

\[A^{-1}=\frac{1}{|A|}A^* \tag{2.10} \]

如果\(|A| \neq 0\),则称 \(A\)非奇异矩阵;如果 \(|A|=0\),则称A为奇异矩阵

推论:\(AB=E\)(或\(BA= E\)),则 \(A,B\) 都可逆,且 \(A,B\) 互为逆矩阵(即\(A^{-1}=B,B^{-1}=A\)

3. 逆矩阵的性质

\(n\) 阶矩阵 \(A,B\) 均可逆,则有

  1. \(\lambda\) 是非零实数时,\(\lambda A\)也可逆,且\((\lambda A)^{-1}=\frac{1}{\lambda}A^{-1}\)
  2. \(AB\) 可逆,且 \((AB)^{-1}=B^{-1}A^{-1}\)
  3. \(A^T\) 可逆,且 \((A^T)^{-1}=(A^{-1})^T\)
  4. \(A^{-1}\) 可逆,且 \((A^{-1})^{-1}=A,|A^{-1}|=\frac{1}{|A|}\)
  5. \(A^*\) 可逆,且 \((A^*)^{-1}=(A^{-1})^*=\frac{A}{|A|},A^*=|A|A^{-1},|A^*|=|A|^{n-1}\)

第四节 分块矩阵

一、分块矩阵

定义11: 将矩阵用一些横线和纵线分割成若干个小块,每个小块称为矩阵的子块,以子块为元素的形式上的矩阵称为分块矩阵,如

\[A=\begin{pmatrix} a & b & 1 & 0\\ c & d & 0 & 1\\ 0 & 0 & p & q\\ 0 & 0 & r & s\\ \end{pmatrix} =\begin{pmatrix} A_{11} & E\\ O & A_{22} \end{pmatrix} \]

其中 \(A_{11}=\begin{pmatrix}a & b\\c & d\end{pmatrix},A_{22}=\begin{pmatrix}p & q\\r & s\end{pmatrix}\)

可以按行分块

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} = \begin{pmatrix} A_1\\ A_2\\ \vdots\\ A_m \end{pmatrix} \]

也可以按列分块

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} = \begin{pmatrix} B_1 & B_2 & \cdots & B_n \end{pmatrix} \]

二、分块矩阵的运算

  1. 加法

    \(m \times n\) 矩阵 \(A\)\(B\) 分块法一致,即

    \[A=\begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1r} \\ A_{21} & A_{22} & \cdots & A_{2r} \\ \vdots & \vdots & & \vdots \\ A_{s1} & A_{s2} & \cdots & A_{sr} \\ \end{pmatrix}, B=\begin{pmatrix} B_{11} & B_{12} & \cdots & B_{1r} \\ B_{21} & B_{22} & \cdots & B_{2r} \\ \vdots & \vdots & & \vdots \\ B_{s1} & B_{s2} & \cdots & B_{sr} \\ \end{pmatrix} \]

    其中每一个 \(A_{ij}\)\(B_{ij}\) 都是同型矩阵,则:

    \[A+B= \begin{pmatrix} A_{11} + B_{11} & A_{12} + B_{12} & \cdots & A_{1r} + B_{1r} \\ A_{21} + B_{21} & A_{22} + B_{22} & \cdots & A_{2r} + B_{2r} \\ \vdots & \vdots & & \vdots \\ A_{s1} + B_{s1} & A_{s2} + B_{s2} & \cdots & A_{sr} + B_{sr} \\ \end{pmatrix} \]

  2. 数乘

    \(A=\begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1r} \\ A_{21} & A_{22} & \cdots & A_{2r} \\ \vdots & \vdots & & \vdots \\ A_{s1} & A_{s2} & \cdots & A_{sr} \\ \end{pmatrix}\)\(\lambda\) 为实数,则

    \[\lambda A=\begin{pmatrix} \lambda A_{11} & \lambda A_{12} & \cdots & \lambda A_{1r} \\ \lambda A_{21} & \lambda A_{22} & \cdots & \lambda A_{2r} \\ \vdots & \vdots & & \vdots \\ \lambda A_{s1} & \lambda A_{s2} & \cdots & \lambda A_{sr} \\ \end{pmatrix} \]

  3. 乘法

    \(A\)\(m \times l\) 矩阵,\(B\)\(l \times n\) 矩阵,且 \(A\) 的列的分法与 \(B\) 的行的分法一致,即

    \[A=\begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1t} \\ A_{21} & A_{22} & \cdots & A_{2t} \\ \vdots & \vdots & & \vdots \\ A_{s1} & A_{s2} & \cdots & A_{st} \\ \end{pmatrix}, B=\begin{pmatrix} B_{11} & B_{12} & \cdots & B_{1r} \\ B_{21} & B_{22} & \cdots & B_{2r} \\ \vdots & \vdots & & \vdots \\ B_{t1} & B_{t2} & \cdots & B_{tr} \\ \end{pmatrix} \]

    \[AB=\begin{pmatrix} C_{11} & C_{12} & \cdots & C_{1r} \\ C_{21} & C_{22} & \cdots & C_{2r} \\ \vdots & \vdots & & \vdots \\ C_{s1} & C_{s2} & \cdots & C_{sr} \\ \end{pmatrix} \]

    其中 \(C_{ij}=A_{i1}B_{1j}+\cdots+A_{it}B_{tj};i=1,2,\cdots,s;j=1,2,\cdots,r\)

  4. 转置矩阵

    \[A=\begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1r} \\ A_{21} & A_{22} & \cdots & A_{2r} \\ \vdots & \vdots & & \vdots \\ A_{s1} & A_{s2} & \cdots & A_{sr} \\ \end{pmatrix} \]

    \[A^T=\begin{pmatrix} A_{11}^T & A_{21}^T & \cdots & A_{s1}^T \\ A_{12}^T & A_{22}^T & \cdots & A_{s2}^T \\ \vdots & \vdots & & \vdots \\ A_{1r}^T & A_{2r}^T & \cdots & A_{sr}^T \\ \end{pmatrix} \]


讲义补充:

  1. 逆矩阵

    \(B,C\) 分别是 \(m\) 阶和 \(n\) 阶可逆矩阵,则

    \[\begin{pmatrix} B & 0\\ 0 & C \end{pmatrix}^{-1} = \begin{pmatrix} B^{-1} & 0\\ 0 & C^{-1} \end{pmatrix}, \begin{pmatrix} 0 & B\\ C & 0 \end{pmatrix}^{-1} = \begin{pmatrix} 0 & C^{-1}\\ B^{-1} & 0 \end{pmatrix} \]

附.矩阵乘法中,行列分块的意义

\(A\)\(m \times n\) 矩阵,\(B\)\(n \times s\) 矩阵, \(AB=C\)

  1. \(B\)\(C\) 矩阵按列分块,有

    \[AB=A(b_1,b_2,\cdots,b_s)=(Ab_1,Ab_2,\cdots,Ab_s)=(c_1,c_2,\cdots,c_s)\\ Ab_i=c_i\ \ (i=1,2,\cdots,s) \]

    \(b_i\) 是方程组 \(Ax=c_i\) 的解。

    \(C=0\) 时,有 \(Ab_i=0\ \ (i=1,2,\cdots,s)\)

    \(B\) 的列向量是齐次方程组 \(Ax=0\) 的解

  2. \(B,C\) 按行分块有

    \[\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix} = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_m \end{pmatrix} \]

    \[\begin{cases} a_{11}\beta_1 + a_{12}\beta_2 + \cdots + a_{1n}\beta_n=\alpha_1\\ a_{21}\beta_1 + a_{22}\beta_2 + \cdots + a_{2n}\beta_n=\alpha_2\\ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\cdots\\ a_{m1}\beta_1 + a_{m2}\beta_2 + \cdots + a_{mn}\beta_n=\alpha_m\\ \end{cases} \]

    可见矩阵 \(C\) 的行向量 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 可由 \(B\) 的行向量 \(\beta_1,\beta_2,\cdots,\beta_n\) 线性表示

    证明:

    \[\alpha_{11}=a_{11}\beta_{11} + a_{12}\beta_{21} + \cdots + a_{1n}\beta_{n1}\\ \vdots\\ \alpha_{1j}=a_{11}\beta_{1j} + a_{12}\beta_{2j} + \cdots + a_{1n}\beta_{nj}\\ \vdots\\ \alpha_{1s}=a_{11}\beta_{1s} + a_{12}\beta_{2s} + \cdots + a_{1n}\beta_{ns}\\ \]

    所以

    \[\alpha_1=a_{11}\beta_{1} + a_{12}\beta_{2} + \cdots + a_{1n}\beta_{n}\\ \]

  3. 对矩阵 \(A,C\) 按列分块,有

    \[(\gamma_1,\gamma_2,\cdots,\gamma_n) \begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1s} \\ b_{21} & b_{22} & \cdots & b_{2s} \\ \vdots & \vdots & & \vdots \\ b_{n1} & b_{n2} & \cdots & b_{ns} \\ \end{pmatrix} = (\delta_1,\delta_2,\cdots,\delta_s) \]

    由此得

    \[\begin{cases} b_{11}\gamma_1+b_{21}\gamma_2+\cdots+b_{n1}\gamma_n=\delta_1\\ b_{12}\gamma_1+b_{22}\gamma_2+\cdots+b_{n2}\gamma_n=\delta_2\\ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\cdots\\ b_{1s}\gamma_1+b_{2s}\gamma_2+\cdots+b_{ns}\gamma_n=\delta_s \end{cases} \]

    即矩阵 \(C\) 的列向量可以由 \(A\) 的列向量线性表出

  4. 对矩阵 \(A\) 按行分块,矩阵 \(B\) 按列分块得到

    \[\begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_m \end{pmatrix} (\beta_1,\beta_2,\cdots,\beta_s)=\begin{pmatrix} \alpha_1\cdot\beta_1 & \alpha_1\cdot\beta_2 & \cdots & \alpha_1\cdot\beta_s\\ \alpha_2\cdot\beta_1 & \alpha_2\cdot\beta_2 & \cdots & \alpha_2\cdot\beta_s\\ \vdots & \vdots & &\vdots\\ \alpha_m\cdot\beta_1 & \alpha_m\cdot\beta_2 & \cdots & \alpha_m\cdot\beta_s\\ \end{pmatrix} \]

    矩阵 \(C\) 中的元素为对应\(A\) 中行向量与 \(B\) 中列向量的点积

例: \(AB=C\)

\(A\) 可逆,可得

\[AB=C\\ A^{-1}C=B \]

\(C\) 的行向量可由 \(B\) 的行向量线性表示,\(B\) 的行向量可由 \(C\) 的行向量线性表示。

\(A\) 为可逆矩阵,所以 \(A\) 可表示成有限个初等矩阵的乘积(第三张第一节第二部分的定理2)。因此 \(AB\) 相当于对 \(B\) 做初等行变换(左行右列)得到矩阵 \(C\),所以矩阵 \(B,C\) 等价

同理若 \(B\) 可逆,可得

\[AB=C\\ CB^{-1}=A \]

\(C\) 的列向量可由 \(A\) 的列向量线性表示,\(A\) 的列向量可由 \(C\) 的列向量线性表示。


三、分块对角矩阵

定义12: 形如 \(A=\begin{pmatrix} A_1 & & & \\ & A_2 & & \\ & & \ddots & \\ & & & A_n \\ \end{pmatrix}\)的分块矩阵称为分块对角矩阵,简记为 \(A=diag(A_1,A_2,\cdots,A_r)\),其中 \(A_i(i=1,2,\cdots,r)\) 为方阵

分块对角矩阵有以下性质:

  1. \(A=diag(A_1,A_2,\cdots,A_r)\) ,则有 \(|A|=|A_1||A_2|\cdots|A_r|,A^k=diag(A_1^k,A_2^k,\cdots,A_r^k)\)
  2. \(A_i(i=1,2,\cdots,r)\) 均可逆,则 \(A^{-1}=diag(A_1^{-1},A_2^{-1},\cdots,A_3^{-1})\)

第三章 矩阵的初等变换

第一节 初等变换

一、初等变换

定义1: 下面三种变换称为矩阵的初等行变换

  1. 交换两行位置
  2. 以数 \(k \neq 0\) 乘某一行中的所有元素
  3. 把某一行所有元素的 \(k\) 倍加到另一行的对应元素上

为简便起见,通常用表示矩阵第 \(i\) 行,用\(r_i \rightarrow r_j\) ,表示交换矩阵的第 \(i\) 行和第 \(j\) 行,用 \(kr_i\) 表示数 \(k\) 乘矩阵的第 \(i\) 行,用 \(r_j+kr_i\) 表示数 \(k\) 乘矩阵的第 \(i\) 行加到第 \(j\) 行上;

将上述定义中的“行”换成“列”,\(r\) 换成 \(c\),即得到矩阵的初等列变换的定义;

矩阵的初等行变换和列变换统称为矩阵的初等变换

\(A\) 经过有限次初等行变换变成 \(B\),记作 \(A \stackrel{r}{\longrightarrow} B\),若 \(A\) 经过有限次初等列变换变成 \(B\),记作\(A \stackrel{c}{\longrightarrow} B\).

定义2: 若矩阵 \(A\) 经过有限次初等变换变成 \(B\),则称矩阵 \(A\)\(B\) 等价,记作 \(A\leftrightarrow B\).

个人补充:把矩阵的行看作向量空间内的向量。初等行变换相当于向量空间内的 加法 和 数乘。无论怎么变换都是在当前这个向量空间内,所以称其为“初等行变换”。“初等列变换”也是如此。\(A\) 经过初等变换得到 \(B\) ,因为其构成相同维度的向量空间,所以称呼 \(A,B\) 等价

矩阵的等价具有以下性质:

  1. 反身性:\(A \leftrightarrow B\)
  2. 对称性:如果 \(A\leftrightarrow B\),则\(B \leftrightarrow A\)
  3. 传递性:如果 \(A \leftrightarrow B,B \leftrightarrow C\),则 \(A \leftrightarrow C\).

消元法一般由两个步骤构成。

第一个步骤是消元过程,得到行阶梯形

行阶梯形的特点

  1. 若有零行,则零行全部位于非零行的下方

  2. 每个非零行的首个非零元素(从左到右的第一个不为零的元素)前面零元素的个数随着行标的增加而严格增加。如下列矩阵

    \[A_1=\begin{pmatrix} 0 & 1 & 2 & 1\\ 0 & 0 & 0 & 5\\ 0 & 0 & 0 & 0\\ \end{pmatrix}, A_2=\begin{pmatrix} 2 & 1 & 2 & 1\\ 0 & 1 & 1 & 1\\ 0 & 0 & 1 & 2\\ 0 & 0 & 0 & 5\\ \end{pmatrix}, A_3=\begin{pmatrix} 1 & 2 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\\ 0 & 0 & 0 & 0\\ \end{pmatrix} \tag{3.2} \]

    都是行阶梯形矩阵

第二个步骤是代入过程,得到行最简形

行最简形的特点:

  1. 是特殊的行阶梯形
  2. 每个非零行左边首个非零元素为1
  3. 每个非零行首个非零元素所在列的其他元素都为0。如式(3.2)中的 \(A_3\) 是行最简形矩阵.

定理1: 任何一个矩阵A 都可经有限次初等行变换变成行阶梯形矩阵和行最简形矩阵.

定义3: 形如\(\begin{pmatrix}E_r & O\\ O & O\end{pmatrix}\) 的矩阵称为标准形矩阵,其中 \(E_r\)\(r\) 阶单位矩阵。

由以上讨论可知:

  1. 任意矩阵经过有限次初等变换可以变成标准形矩阵,且两个等价矩阵的标准形矩阵是相同的;
  2. \(n\) 阶可逆矩阵的标准形矩阵是 \(n\) 阶单位阵 \(E_n\)

二、初等矩阵

定义4: 由单位矩阵 \(E\) 经过一次初等变换得到的矩阵称为初等矩阵,简称初等阵。三种初等变换对应三种初等矩阵。

1. 交换初等阵 \(E(i,j)\)

由单位矩阵 \(E\) 交换第 \(i\) 行(列)第 \(j\) 行(列)得到的矩阵。

\[E(i,j)=\begin{pmatrix} 1 & & & & & & & & & & \\ & \ddots & & & & & & & & & \\ & &1 & & & & & & & & \\ & & &0 &\cdots &\cdots &\cdots &1 & & & \\ & & &\vdots &1 & & &\vdots & & & \\ & & &\vdots & &\ddots & &\vdots & & & \\ & & &\vdots & & &1 &\vdots & & & \\ & & &1 &\cdots &\cdots &\cdots &0 & & & \\ & & & & & & & &1 & & \\ & & & & & & & & &\ddots & \\ & & & & & & & & & &1 \\ \end{pmatrix} \begin{align} \\ \\ \\ \leftarrow第i行\\ \\ \\ \\ \leftarrow第j行\\ \\ \\ \\ \end{align} \]

容易证明:

  1. \(|\boldsymbol{E}(i,j)|=-1\),且\(\boldsymbol{E}^{-1}(i,j) = \boldsymbol{E}(i,j)\)
  2. \(\boldsymbol{A}=(a_{ij})_{m \times n}\),则 \(\boldsymbol{E}(i,j)\boldsymbol{A}=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a_{j1} & a_{j2} & \cdots & a_{jn} \\ \vdots & \vdots & & \vdots \\ a_{i1} & a_{i2} & \cdots & a_{in} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} \begin{align}\\ \\ \leftarrow第i行\\ \\ \leftarrow第j行\\ \\ \\ \end{align}\)

因此 \(\boldsymbol{E}_m(i,j)\) 左乘矩阵 \(\boldsymbol{A}\) 其结果相当于交换矩阵 \(\boldsymbol{A}\) 中的第 \(i\) 行和第 \(j\) 行,同理可得,\(\boldsymbol{E}_n(i,j)\) 右乘矩阵A其结果相当于交换矩阵A中的第 \(i\) 列和第 \(j\) 列.

总结:左行右列

2.倍乘初等阵

由单位矩阵 \(E\) 的第 \(i\) 行(列)乘不为 \(0\) 的数得到的矩阵。

\[E(i,j)=\begin{pmatrix} 1 & & & & & & \\ & \ddots & & & \\ & &1 & & & & \\ & & &k & & & \\ & & & &1 & & \\ & & & & &\ddots \\ & & & & & &1 \\ \end{pmatrix} \begin{align} \\ \\ \\ \leftarrow 第i行\\ \\ \\ \\ \end{align} \]

容易证明:

  1. \(|\boldsymbol{E}(i(k))|=k\),且\(\boldsymbol{E}^{-1}(i(k)) = \boldsymbol{E}(i(\frac{1}{k}))\)
  2. \(\boldsymbol{E}_m(i(k))\) 左乘矩阵 \(\boldsymbol{A}\),其结果相当于以数 \(k\)\(\boldsymbol{A}\) 中的第 \(i\) 行;\(\boldsymbol{E}_n(i(k))\) 右乘矩阵 \(\boldsymbol{A}\),其结果相当于以数 \(k\)\(\boldsymbol{A}\) 中的第 \(i\) 列;

3.倍加初等阵

由单位矩阵的第 \(j\) 行乘以数 \(k\) 加到第 \(i\) 行上而得到的矩阵。

\[E(i,j)=\begin{pmatrix} 1 & & & & & & & & & & \\ & \ddots & & & & & & & & & \\ & &1 & & & & & & & & \\ & & &1 &\cdots &\cdots &\cdots &k & & & \\ & & &\vdots &1 & & &\vdots & & & \\ & & &\vdots & &\ddots & &\vdots & & & \\ & & &\vdots & & &1 &\vdots & & & \\ & & &0 &\cdots &\cdots &\cdots &1 & & & \\ & & & & & & & &1 & & \\ & & & & & & & & &\ddots & \\ & & & & & & & & & &1 \\ \end{pmatrix} \begin{align} \\ \\ \\ \leftarrow第i行\\ \\ \\ \\ \leftarrow第j行\\ \\ \\ \\ \end{align} \]

可以证明

  1. \(|\boldsymbol{E}(i, j(k))|=1, \quad \boldsymbol{E}^{-1}(i, j(k))=\boldsymbol{E}(i, j(-k))\)
  2. \(\boldsymbol{E}_m(i,j(k))\) 左乘矩阵 \(\boldsymbol{A}\),其结果相当于以数 \(k\)\(\boldsymbol{A}\) 中的\(j\) 行加到第 \(i\)\(\boldsymbol{E}_n(i,j(k))\) 右乘矩阵 \(\boldsymbol{A}\),其结果相当于以数 \(k\)\(\boldsymbol{A}\) 中的\(i\) 列加到第 \(j\)

总结以上的讨论,有:

  1. 初等矩阵都可逆,且逆矩阵为同类的初等矩阵;
  2. \(\boldsymbol{A}\)\(m\times n\) 矩阵,对 \(\boldsymbol{A}\) 作一次初等行变换,相当于在 \(\boldsymbol{A}\) 的左边乘了一个相应的 \(m\) 阶初等矩阵;对 \(\boldsymbol{A}\) 作一次初等列变换,相当于在 \(\boldsymbol{A}\) 的右边乘了一个相应的 \(n\) 阶初等矩阵.

定理2: \(n\) 阶矩阵 \(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\) \(\boldsymbol{A}\) 可表示成有限个初等矩阵的乘积.

定理3:\(\boldsymbol{A}\)\(\boldsymbol{B}\) 均为 \(m \times n\) 矩阵,则

  1. \(\boldsymbol{A}\stackrel{r}{\longrightarrow} \boldsymbol{B} \Leftrightarrow\) 存在 \(m\) 阶可逆矩阵 \(\boldsymbol{P}\),使 \(\boldsymbol{P}\boldsymbol{A}=\boldsymbol{B}\)
  2. \(\boldsymbol{A}\stackrel{c}{\longrightarrow} \boldsymbol{B} \Leftrightarrow\) 存在 \(n\) 阶可逆矩阵 \(\boldsymbol{Q}\),使 \(\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{B}\)
  3. \(\boldsymbol{A}\longrightarrow \boldsymbol{B} \Leftrightarrow\) 存在 \(m\) 阶可逆矩阵 \(\boldsymbol{P}\)\(n\) 阶可逆矩阵 \(\boldsymbol{Q}\),使 \(\boldsymbol{P}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{B}\)

推论: \(n\) 阶矩阵 \(\boldsymbol{A}\) 可逆 \(\Leftrightarrow\boldsymbol{A}\stackrel{r}{\longrightarrow} \boldsymbol{E}\)

三、初等变换求逆矩阵

下面我们给出求逆矩阵的另一种方法

\(n\) 阶矩阵 \(\boldsymbol{A}\) 可逆,则存在 \(n\) 阶可逆矩阵 \(\boldsymbol{P}\),使得 \(\boldsymbol{P}\boldsymbol{A}= \boldsymbol{E}\),所以 \(\boldsymbol{P}=\boldsymbol{A}^{-1}\) 。那么该如何求出P呢?

注意到 \(\boldsymbol{P}\boldsymbol{A}= \boldsymbol{E},\boldsymbol{P}\boldsymbol{E}= \boldsymbol{A}^{-1}\),可得

\[P(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{E}\end{array})=P(\begin{array}{c:c}\boldsymbol{P}\boldsymbol{A} & \boldsymbol{P}\boldsymbol{E}\end{array})=P(\begin{array}{c:c}\boldsymbol{E} & \boldsymbol{A}^{-1}\end{array}) \tag{3.3} \]

也就是说对 \((\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{E}\end{array})\) 作初等行变换,那么当 \(\boldsymbol{A}\) 变成 \(\boldsymbol{E}\) 时,\(\boldsymbol{E}\) 也就变成了 \(\boldsymbol{A}^{-1}\),具体步骤如下:

  1. 写出 \(n \times 2n\) 矩阵\((\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{E}\end{array})\)
  2. \((\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{E}\end{array})\) 作初等行变换化为行最简形 \(\boldsymbol{C}\)
  3. 写出 \(\boldsymbol{A}^{-1}\),即行最简形 \(\boldsymbol{C}\) 中的后 \(n\) 列元素对应的矩阵

这种方法也可应用于解矩阵方程和解一类线性方程组:

  1. 对于矩阵方程 \(\boldsymbol{A}\boldsymbol{X}=\boldsymbol{B}\),若 \(\boldsymbol{A}\) 可逆,则有 \(\boldsymbol{X}=\boldsymbol{A}^{-1}\boldsymbol{B}\),在式(3.3)中将 \(\boldsymbol{E}\) 换成 \(\boldsymbol{B}\) 可得,即

    \[(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{B}\end{array}) \stackrel{r}{\longrightarrow} (\begin{array}{c:c}\boldsymbol{E} & \boldsymbol{A}^{-1}\boldsymbol{B}\end{array}) \tag{3.4} \]

  2. 对于系数矩阵为方阵的线性方程组 \(\boldsymbol{A}\boldsymbol{X}=\boldsymbol{b}\),同样有

    \[(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{b}\end{array}) \stackrel{r}{\longrightarrow} (\begin{array}{c:c}\boldsymbol{E} & \boldsymbol{A}^{-1}\boldsymbol{b}\end{array}) \tag{3.5} \]

这里 \((\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{b}\end{array})\) 就是矩阵的增广矩阵,因此只需要把增广矩阵化为行最简形,最后一列即为方程组的解。

第二节 矩阵的秩

一、矩阵的秩

定义5:\(\boldsymbol{A}\)\(m\times n\) 矩阵,在 \(\boldsymbol{A}\) 中任取 \(k\)\(k\)\((1 \leq k \leq min\{m,n\})\),位于这些行、列交叉处的 \(k^2\) 个元素,不改变它们在 \(\boldsymbol{A}\) 中原有位置而构成的 \(k\) 阶行列式,称为 \(\boldsymbol{A}\)\(k\) 阶子式。如果某个子式是零,就称为零子式,否则称为非零子式。

定义6: 若矩阵 \(\boldsymbol{A}\) 中存在一个 \(r\) 阶非零子式 \(D_r\),且所有的 \(r+1\) 阶子式(如果存在的话)全为零子式,则称 \(r\) 阶非零子式 \(D_r\)为矩阵 \(\boldsymbol{A}\) 的最高阶非零子式,数 \(r\) 称为矩阵 \(\boldsymbol{A}\),记为 \(R(A)\).

由于零矩阵 \(\boldsymbol{O}\) 不存在非零子式,我们规定零矩阵的秩等于0.

注(1): \(\boldsymbol{A}\) 的秩 \(R(\boldsymbol{A})\) 即为矩阵 \(\boldsymbol{A}\) 的非零子式的最高阶数

注(2): \(n\) 阶矩阵,其 \(n\) 阶子式为 \(|A|\),则\(R(\boldsymbol{A})=n\) 当且仅当\(|A|\neq0\),此时称 \(\boldsymbol{A}\)满秩矩阵;而 $R(\boldsymbol{A})< $n当且仅当 \(|A|=0\),此时称 \(\boldsymbol{A}\)降秩矩阵。因此,可逆矩阵(非奇异矩阵)又称为满秩矩阵,不可逆矩阵(奇异矩阵)称为降秩矩阵.

二、秩的计算

定理4: 初等变换不改变矩阵的秩

个人补充:初等变换相当于在同一个向量空间内对 向量 做运算,不会创造出不属于当前这个向量空间的向量,也就不会导致向量空间维度的增减

由此可知:

  1. \(\boldsymbol{A}\rightarrow\boldsymbol{B}\),则 \(R(\boldsymbol{A})=R(\boldsymbol{B})\).即等价的矩阵等秩,反之不一定成立.
  2. 求矩阵的秩的另一种方法:把矩阵 \(\boldsymbol{A}\) 通过初等行变换变为行阶梯形矩阵 \(\boldsymbol{B}\),则行阶梯形矩阵 \(\boldsymbol{B}\) 的非零行数即为矩阵 \(\boldsymbol{A}\) 的秩.

三、秩的性质

根据矩阵秩的定义和定理4,容易得到矩阵的秩具有下列性质:

  1. \(\boldsymbol{A}\)\(m \times n\) 矩阵,则 $0 \leq R(\boldsymbol{A})\leq min{m,n} $.
  2. 若矩阵 \(\boldsymbol{A}\) 中有某个 \(s\) 阶子式不为零,则 \(R(\boldsymbol{A}) \geq s\).
  3. 矩阵 \(\boldsymbol{A}\) 中所有 \(t\) 阶子式全为零,则 \(R(\boldsymbol{A})\leq t\).
  4. \(R(\boldsymbol{A})=R(\boldsymbol{A}^T)\)
  5. \(R(\lambda \boldsymbol{A})=\begin{cases}0,&\lambda = 0\\R(A),&\lambda \neq0\end{cases}\),其中 \(\lambda\) 是常数

附.几个常用的矩阵秩的性质(假定其中运算都是可行的):

性质1: \(max\{R(\boldsymbol{A}),R(\boldsymbol{B})\}\leq R(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{B}\end{array})\leq R(\boldsymbol{A})+R(\boldsymbol{B})\) .

特别地,若 \(\boldsymbol{B}\) 只有1列,设为 \(\beta\) ,则 \(R(\boldsymbol{A})\leq R(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{\beta}\end{array})\leq R(\boldsymbol{A})+1\)

性质2: \(R(\boldsymbol{A}+\boldsymbol{B})≤R(\boldsymbol{A})+R(\boldsymbol{B})\)

性质3: \(R(\boldsymbol{A}\boldsymbol{B})≤min\{R(\boldsymbol{A}),R(\boldsymbol{B})\}\) .

性质4:\(\boldsymbol{A}_{m\times n}\boldsymbol{B}_{n\times l}= \boldsymbol{O}\),则 \(R(\boldsymbol{A})+R(\boldsymbol{B})\leq n\).


个人补充:

证明:

\(AB=0\),说明 \(B\) 的列向量都是 \(AX=0\) 的解,由第五章第三节第一部分的定理5可知,\(R(X_A)=n-R(A)\),矩阵 \(B\) 的列秩 \(\leq\) 方程组 \(AX=0\) 的基础解系的个数。所以 \(R(B)\leq n-R(A)\)


性质5:\(\boldsymbol{A}\)\(m \times n\) 矩阵,\(\boldsymbol{P}\)\(m\) 阶可逆矩阵,\(\boldsymbol{Q}\)\(n\) 阶可逆矩阵,则

\[R(\boldsymbol{P}\boldsymbol{A}\boldsymbol{Q})= R(\boldsymbol{P}\boldsymbol{A})= R(\boldsymbol{A}\boldsymbol{Q})= R(\boldsymbol{A}) \]


个人补充:

证明:

根据第三章第一节第二部分的定理2可知,矩阵可逆,则矩阵可表示成有限个初等矩阵的乘积。可逆矩阵 左乘 或 右乘 矩阵 \(A\),相对于对矩阵 \(A\) 进行 初等行变换 或者 初等列变换。而根据第三章第二节第二部分的定理4可知,初等变换不改变矩阵的秩,所以矩阵 \(A\) 乘以可逆矩阵不会改变矩阵的秩



讲义补充:

  1. 若秩 \(R(A)=1\) ,则 \(A\) 可分解为一个列向量和一个行向量的乘积,有\(A^2=lA\) 的规律,从而 \(A^n=l^{n-1}A\)

    \[A=\begin{pmatrix} a_1b_1 & a_1b_2 & a_1b_3\\ a_2b_1 & a_2b_2 & a_2b_3\\ a_3b_1 & a_3b_2 & a_3b_3\\ \end{pmatrix} =\begin{pmatrix} a_1\\ a_2\\ a_3 \end{pmatrix} (b_1,b_2,b_3) =\alpha\beta^T \\ A^2=(\alpha\beta^T)(\alpha\beta^T)=\alpha(\beta^T\alpha)\beta^T=l\alpha\beta^T=lA\\ l=\beta^T\alpha=a_1b_1+a_2b_2+a_3b_3=\sum a_{ii} \]

    直观理解: \(R(A)=1\),则矩阵 \(A\) 的每一列向量都可以表示成向量 \(k\alpha\) 的形式。相当于对一个列向量右乘一个行向量

  2. \(A\)\(n\) 阶矩阵,\(A^*\)\(A\) 的伴随矩阵,则有

\[r(A^*)=\begin{cases} n,&若r(A)=n,\\ 1,&若r(A)=n-1,\\ 0,&若r(A)<n-1,\ \end{cases} \]

  1. \(r(A^TA)=r(A)\)

    证明:

    \(A\)\(m\times n\) 阶矩阵,证明齐次线性方程组 \((I)A^TA\alpha=0\)\((II)Ax=0\) 同解

    如果 \(\alpha\)\((II)\) 的解,则 \(A\alpha=0\) 显然 \(A^TA\alpha=0\),即 \(\alpha\)\((I)\) 的解,故 \((II)\) 的解全是 \((I)\) 的解

    \(\alpha\)\((I)\) 的解,即 \(A^TA\alpha=0\),那么 \(\alpha^TA^TA\alpha=0\),即 \((A\alpha)^T(A\alpha)=0\),从而 \(\left\| A\alpha \right\|=0\),故 \(A\alpha=0\),所以 \(\alpha\) 必是 \((II)\) 的解,即 \((I)\) 的解全是 \((II)\) 的解

    综上所述,方程组 \((I)\)\((II)\) 同解

    所以它们的基础解系所含解向量个数相同,即有 \(n-r(A^TA)=n-r(A)\),故 \(r(A^TA)=r(A)\)


第三节 线性方程组的解

考虑线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \\ \end{cases}\tag{3.6} \]

记矩阵

\[A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix}, X=\begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix}, b=\begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_n \end{pmatrix}方程组(2.6)可以表示为 \]

方程组(3.6)可以表示为

\[A_{m\times n}X_{n\times 1}=b_{m\times 1}\tag{3.7} \]

如果 \(\boldsymbol{b}\neq 0\),则方程组(3.6)称为非齐次线性方程组;如果 \(\boldsymbol{b}=0\),则方程组(3.6)称为齐次线性方程组,其矩阵形式为

\[A_{m\times n}X_{n\times 1}=0_{m\times 1}\tag{3.8} \]

一、初等行变换法求解线性方程组

将增广矩阵 $(\begin{array}{c:c}\boldsymbol{A} & \boldsymbol{b}\end{array}) $ 化成行最简形,其对应的方程组就是和方程组(3.6)同解的最简方程组,从最简方程组可求解出方程组的解

二、线性方程组解的判定

对一般的非齐次线性方程组 \(\boldsymbol{A}_{m\times n}\boldsymbol{X}_{n\times 1} = \boldsymbol{b}_{m \times 1}\),有以下解的重要判定定理:

定理5: 对于非齐次线性方程组(3.7),其系数矩阵为 \(\boldsymbol{A}\),其增广矩阵为 \(\boldsymbol{\overline{A}}\),则

  1. 非齐次线性方程组(3.7)无解的充分必要条件是 \(R(\boldsymbol{A})<R(\boldsymbol{\overline{A}})\)
  2. 非齐次线性方程组(3.7)有唯一解的充分必要条件是 \(R(\boldsymbol{A})= R(\boldsymbol{\overline{A}})= n\);
  3. 非齐次线性方程组(3.7)有无穷多解的充分必要条件是 \(R(\boldsymbol{A})=R(\boldsymbol{\overline{A}})< n\).

推论:\(m=n\) 时,非齐次线性方程组(3.7)有唯一解的充分必要条件是其系数行列式 \(|A|\neq 0\).

由于齐次线性方程组 \(\boldsymbol{A}_{m\times n}\boldsymbol{X}_{n\times 1} = \boldsymbol{0}_{m \times 1}\)中至少有一个零解,因此可得下面定理。

定理6: 对于齐次线性方程组(3.8),其系数矩阵为 \(\boldsymbol{A}\),则

  1. 齐次线性方程组(3.8)只有零解的充分必要条件是 \(R(\boldsymbol{A})=n\)
  2. 齐次线性方程组(3.8)有非零解的充分必要条件是 \(R(\boldsymbol{A})<n\)

推论1:\(m<n\) 时,齐次线性方程组(3.8)必有非零解.

推论2:\(m=n\) 时,齐次线性方程组(3.8)非零解的充分必要条件是其系数行列式 \(|\boldsymbol{A}| = 0\);齐次线性方程组(3.8)只有零解的充分必要条件是其系数行列式\(|\boldsymbol{A}|\neq 0\).

第四章 向量的线性关系

第一节 向量及其线性表示

一、\(n\) 维向量

定义1:\(n\) 个数 \(x_1,x_2,\cdots,x_n\) 组成的有序数组 \((x_1,x_2,\cdots,x_n)\) 称为一个 \(n\) 维向量,\(n\) 称为向量的维数。如果 \(x_1,x_2,\cdots,x_n\) 都是实数,则称该向量为实向量.
\(\alpha = (x_1,x_2,\cdots,x_n)\) 为行向量,称 \(\beta=\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}\)为列向量,本书中,如果没有特别说明,向量一般指的是列向量。向量通常用 \(\alpha,\beta,\gamma,\cdots\) 黑体字母表示。

若向量的各个分量全为 \(0\) ,则称之为零向量,记作 \(\boldsymbol{0}\) 。两个向量相等当且仅当二者的所有分量对应相等。

全体 \(n\) 维向量的集合记作:

\[\boldsymbol{R}^n=\{\boldsymbol{\alpha}=(x_1,x_2,\cdots,x_n)^T|x_i\in \boldsymbol{R},i=1,2,\cdots,n\} \tag{4.1} \]

二、向量的线性运算

定义2:\(\boldsymbol{\alpha}=\begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix}, \boldsymbol{\beta}= \begin{pmatrix} y_1\\ y_2\\ \vdots\\ y_n \end{pmatrix}\)\(n\) 维向量,\(k\) 为一个数,定义向量的加法减法数乘分别为:

\[\boldsymbol{\alpha}+\boldsymbol{\beta}=\begin{pmatrix} x_1+y_1\\ x_2+y_2\\ \vdots\\ x_n+y_n \end{pmatrix}, \boldsymbol{\alpha}-\boldsymbol{\beta}=\begin{pmatrix} x_1-y_1\\ x_2-y_2\\ \vdots\\ x_n-y_n \end{pmatrix}, k\boldsymbol{\alpha}=\begin{pmatrix} kx_1\\ kx_2\\ \vdots\\ kx_n \end{pmatrix} \tag{4.2} \]

向量的加法和数乘统称为向量的线性运算

定义3: 设向量组 \(\boldsymbol{A}:\alpha_1,\alpha_2,\cdots,\alpha_m\)为一组 \(n\) 维向量,对任意一组实数 \(c_1,c_2,\cdots,c_m\),称 \(c_1\alpha_1+c_2\alpha_2+\cdots+c_m\alpha_m\) 为向量组 \(\boldsymbol{A}\) 的一个线性组合, \(c_1,c_2,\cdots,c_m\)称为组合系数.若向量 \(\beta\) 满足 \(\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m\),其中 \(k_1,k_2,\cdots,k_m\) 为某一组实数,则称 \(\beta\) 可由向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性表示.

对于线性方程组

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots\cdots\\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \\ \end{cases} \]

若记

\[\boldsymbol{\alpha}_i=\begin{pmatrix}a_{1i}\\a_{2i}\\\vdots\\a_{mi}\end{pmatrix},(i=1,2,\cdots,n), \boldsymbol{X}=\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}, \boldsymbol{\beta}=\begin{pmatrix}b_1\\b_2\\\vdots\\b_m\end{pmatrix} \]

则系数矩阵表示为 \(\boldsymbol{A}=(\alpha_1,\alpha_2,\cdots,\alpha_n)\),此时线性方程组有下面向量表达式

\[x_1\alpha_1+x_2\alpha_2+\cdots+x_n\alpha_n=\boldsymbol{\beta} \tag{4.3} \]

定理1: \(n\) 维向量 \(\boldsymbol{\beta}\) 可由 \(n\) 维向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性表示 \(\Leftrightarrow\) 线性方程组 \(x_1\alpha_1+x_2\alpha_2+\cdots+x_m\alpha_m=\boldsymbol{\beta}\) 有解 \(\Leftrightarrow\) 方程组系数矩阵的秩 \(R(\boldsymbol{A})=R(\overline{\boldsymbol{A}})\)(增广矩阵的秩)

第二节 向量组的线性相关性

一、向量组的线性相关

定义4: 若向量组 \(\boldsymbol{A}:\alpha_1,\alpha_2,\cdots,\alpha_m(m\geq 2)\) 中至少有一个向量可由其余 \(m-1\) 个向量线性表示,则称向量组 \(\boldsymbol{A}\) 线性相关,否则称向量组 \(\boldsymbol{A}\) 线性无关.

定理2: 向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\in \boldsymbol{R}^n\) 线性相关的充要条件是存在一组不全为零的数 \(k_1,k_2,\cdots,k_m\),使得

\[k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m=0 \tag{4.4} \]

命题1: \(n\) 维向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性相关 \(\Leftrightarrow\) 线性方程组\(x_1\alpha_1+x_2\alpha_2+\cdots+x_m\alpha_m=0\) 有非零解 \(\Leftrightarrow\) 方程组系数矩阵的秩 \(R(A)<m\).

命题2: \(n\) 维向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性无关 \(\Leftrightarrow\) 线性方程组\(x_1\alpha_1+x_2\alpha_2+\cdots+x_m\alpha_m=0\) 只有零解 \(\Leftrightarrow\) 方程组系数矩阵的秩 \(R(A)=m\).


讲义补充

已知 \(n\) 维向量 \(\alpha_1,\alpha_2,\alpha_3\) 线性无关,若 \(\beta_1,\beta_2,\beta_3\) 可用 \(\alpha_1,\alpha_2,\alpha_3\) 线性表示,设

\[(\beta_1,\beta_2,\beta_3)=(\alpha_1,\alpha_2,\alpha_3)C \]

\(\beta_1,\beta_2,\beta_2\) 线性无关的充分必要条件是 \(|C|\neq 0\)


二、向量组线性相关的性质

性质 1 设向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性无关,而向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m,\beta\) 线性相关,则 \(\beta\) 可以由向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性表示,且表示式位移

推论\(\beta\) 可以由向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性表示,则表示式唯一当且仅当向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性无关。

性质2: 当向量组所含向量个数大于向量维数时,则该向量组必线性相关

推论: \(n+1\)\(n\) 维向量一定线性无关

把向量组的各个向量以同样的方式增加若干个分量得到的向量组称为接长向量组。把向量组的各个向量以同样的方式删除若干个分量得到的向量组称为截短向量组。一个线性相关的向量组截短后仍相关,而一个线性无关的向量组接长后仍无关。

个人补充:\(\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m\) 就算删去一个维度,剩下的维度仍然满足线性相关;同理,在原先的 \(n\) 个维度时都是线性无关,多加一个维度,原来的仍然不符合,依然是线性无关

第三节 向量组的秩

一、向量组的极大无关组

定义5: 给定 \(n\) 维向量组 (I):\(\alpha_1,\alpha_2,\cdots,\alpha_s\) 和 (II):\(\beta_1,\beta_2,\cdots,\beta_t\),如果(II)中的每一个向量都可以由(I)中的向量线性表示,称(I)可以由(II)线性表示。如果(II)可以由(I)线性表示,同时(I)也可以由(II)线性表示,则称(I)和(II)等价.

定义6: 设向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(\boldsymbol{R}^n\) 中向量组 \(A\) 的一个部分组,如果满足

  1. 向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 线性无关
  2. 向量组 \(A\) 中的任意 \(r+1\) 个向量线性相关(如果 \(A\) 存在 \(r+1\) 个向量的话),则称向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_r\)是向量组 \(A\) 的一个极大线性无关向量组(极大无关组).

二、向量组的秩

定理3:\(n\) 维向量组 \(\beta_1,\beta_2,\cdots,\beta_t\) 线性无关,且 \(\beta_1,\beta_2,\cdots,\beta_t\) 可由向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_s\) 线性表示,则必有 \(s \geq t\)

推论 等价的线性无关向量组所含的向量个数必相同.

定义7: 向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 的极大无关组所含向量的个数称为向量组 向量组 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 的秩,记作 \(R(\alpha_1,\alpha_2,\cdots,\alpha_m)\)

定理4: 矩阵 \(A\) 的秩等于它的列向量组的秩,也等于它的行向量组的秩.

定理5: 若向量组 \(A\) 可以由向量组 \(B\) 线性表示,则 \(R(A)\leq R(B)\).

推论: 若向量组 \(A\) 和向量组 \(B\) 等价,则 \(R(A)=R(B)\).

第五章 向量空间

第一节 向量空间

一、向量空间及有关概念

定义1:\(V\)\(R^n\) 的一个非空子集,如果 \(V\) 满足:

  1. \(V\) 对加法运算封闭,即 \(V\) 中任意两个向量的和向量仍在 \(V\) 中;
  2. \(V\) 对数乘运算封闭,即 \(V\) 中任意向量与任一实数的乘积仍在 \(V\)中:

则称V关于向量的线性运算构成实数域上的一个向量空间.

定义2:\(\alpha_1,\alpha_2,\cdots,\alpha_s\in R^n\),则可以验证由该向量组的所有线性组合得到的向量的集合\(U=\{x|x=k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s,k_1,k_2,\cdots,k_s\in R\}\)是一个向量空间。称 \(U\) 是由\(\alpha_1,\alpha_2,\cdots,\alpha_s\) 所生成的子空间(或称为 \(\alpha_1,\alpha_2,\cdots,\alpha_s\)生成子空间),记作 \(U=Span(\alpha_1,\alpha_2,\cdots,\alpha_s)\) 其中 \(\alpha_1,\alpha_2,\cdots,\alpha_s\) 称为 \(U\)生成元

定义3:\(V\) 是向量空间 \(U\) 的一个子集。如果 \(V\) 也是向量空间,则称 \(V\)\(U\) 的子空间

二、向量空间的基、维数和坐标

定义4:\(V\) 是一个向量空间,\(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(V\) 中的一组向量,如果满足:

  1. \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 线性无关
  2. \(V\) 中的任一向量都可由 \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 线性表示

则称 \(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(V\) 的一组基,数 \(r\) 称为 \(V\)维数,记作 \(dim(V)=r\) ,并称 \(V\)\(r\) 维向量空间

定义5:\(V\) 是向量空间,\(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(V\) 的一组基。任给 \(\alpha \in V\),若有

\[\alpha=x_1\alpha_1+x_2\alpha_2+\cdots+x_r\alpha_r=(\alpha_1,\alpha_2,\cdots,\alpha_r)\begin{pmatrix}x_1\\x_2\\\vdots\\x_r\end{pmatrix} \tag{5.1} \]

则称 \(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(\alpha\) 在基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 下的坐标

三、基变幻与坐标变幻*

定义6:\(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(\beta_1,\beta_2,\cdots,\beta_r\) 分别为向量空间 \(V\) 的两组基,且有

\[(\beta_1,\beta_2,\cdots,\beta_r)=(\alpha_1,\alpha_2,\cdots,\alpha_r)P_{r \times r} \tag{5.2} \]

\(r\) 阶方阵 \(P\) 是由基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 到基 \(\beta_1,\beta_2,\cdots,\beta_r\)过渡矩阵,式(5.2)称为基变换公式

显然 \(P\) 可逆

定理1\(V\) 是向量空间,\(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(\beta_1,\beta_2,\cdots,\beta_r\) 分别为 \(V\) 的两组基,且 \(X=(x_1,x_2,\cdots,x_r)\)\(Y=(y_1,y_2,\cdots,y_r)\) 分别是向量 \(\alpha\) 在基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\)\(\beta_1,\beta_2,\cdots,\beta_r\) 下的坐标,则有

\[X=YP^T和Y=X(P^T)^{-1} \tag{5.3} \]

其中 \(P\) 是由基 \(\alpha_1,\alpha_2,\cdots,\alpha_r\) 到基 \(\beta_1,\beta_2,\cdots,\beta_r\) 的过渡矩阵。式(5.3)称为坐标变换公式

第二节 向量内积与正交化

一、向量的内积

定义7: 设有 \(n\) 维向量

\[\alpha= \begin{pmatrix} a_1\\ a_2\\ \vdots\\ a_n \end{pmatrix}, \beta= \begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_n \end{pmatrix} \]

定义它们的内积

\[\langle \alpha,\beta \rangle=a_1b_1+a_2b_2+\cdots+a_nb_n=\sum_{i=1}^na_ib_i \tag{5.4} \]

由矩阵乘法,有 \(\langle \alpha,\beta \rangle=\alpha^T\beta=\beta^T\alpha\)

向量的内积满足以下运算律:

  1. 交换律:\(\langle \alpha,\beta \rangle=\langle \beta,\alpha\rangle\)
  2. 对加法的分配律 \(\langle \alpha,\beta + \gamma \rangle = \langle \alpha,\beta \rangle+\langle \alpha,\gamma \rangle\)
  3. 对数乘的结合律 \(\langle k\alpha,\beta \rangle=\langle \alpha,k\beta \rangle=k\langle \alpha,\beta \rangle\)
  4. 非负性 \(\langle \alpha,\alpha \rangle \geq 0\),当且仅当 \(\alpha = 0\) 时等号成立

定义8: 对于 \(n\) 维向量 \(\alpha = (a_1,a_2,\cdots,a_n)^T\) ,定义

\[\left\| \alpha \right\| = \sqrt{\langle \alpha,\alpha \rangle} = \sqrt{a_1^2+a_2^2+\cdots+a_n^2} \tag{5.5} \]

为向量 \(\alpha\)范数(即长度

定理2: 向量的范数具有下述性质:

  1. 非负性 \(\left\| \alpha \right\|\geq 0\)
  2. 齐次性 \(\left\| k\alpha \right\|=\left| k \right| \left\| \alpha \right\|\)
  3. 柯西-施瓦兹(Cauchy-Schwarts)不等式 \(\langle \alpha,\beta \rangle \leq \left\| \alpha \right\| \cdot \left\| \beta \right\|\)
  4. 三角不等式:\(\left\| \alpha + \beta \right\| \leq \left\| \alpha \right\|+\left\| \beta\right\|\)

长度为 \(1\) 的向量称为单位向量。对任一非零向量 \(\alpha\),向量 \(\frac{\alpha}{\left\| \alpha \right\|}\) 为单位向量,这一过程称为把向量 \(\alpha\) 单位化(也称标准化、规范化

由柯西-施瓦兹不等式,当 \(\alpha,\beta\) 均为非零向量时,有

\[-1\leq \frac{\langle \alpha,\beta \rangle}{\left\| \alpha \right\|\left\| \beta \right\|} \leq 1 \]

于是有向量夹角的定义

定义9:\(n\) 维非零向量 \(\alpha,\beta\) ,称

\[\varphi=arccos\frac{\langle \alpha,\beta \rangle}{\left\| \alpha \right\|\left\| \beta \right\|} \tag{5.6} \]

为向量 \(\alpha\)\(\beta\)夹角

二、向量的正交性

定义10:\(n\) 维向量 \(\alpha,\beta\) 满足 \(\langle \alpha,\beta \rangle=0\) 时,称 \(\alpha\)\(\beta\) 正交(或垂直)。记作 \(\alpha \perp \beta\)

定义3: 向量 \(\alpha\)\(\beta\) 正交的充分必要条件是\(\left\| \alpha+\beta \right\|^2=\left\| \alpha \right\|^2+\left\| \beta \right\|^2\)。即勾股定理

定义11: 当若干非零向量两两正交时,称它们构成的向量组为正交向量组;进一步地,若它们又都是单位向量,则称为标准正交向量组(或正交规范向量组

定理4:\(\alpha_1,\alpha_2,\cdots,\alpha_m\) 是正交向量组,则 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 线性无关

三、施密特正交化

下面介绍施密特(Schmidt)正交化方法。

首先取 \(\beta_1=\alpha_1\),然后构造一个 \(\alpha_1,\alpha_2\) 的线性组合 \(\beta_2=\alpha_2+k\alpha_1=\alpha_2+k\beta_1\)。使 \(\beta_2\)\(\beta_1\) 正交。为此,令\(\langle \beta_2,\beta_1 \rangle=0\)。即 \(\langle \alpha_2,\beta_1 \rangle+k\langle \beta_1,\beta_1 \rangle=0\),解得 \(k=-\frac{\langle \alpha_2,\beta_1 \rangle}{\langle \beta_1,\beta_1 \rangle}\),得到

\[\beta_2=\alpha_2 -\frac{\langle \alpha_2,\beta_1 \rangle}{\langle \beta_1,\beta_1 \rangle}\beta_1 \tag{5.8} \]

这样\(\beta_1,\beta_2\) 正交,且与 \(\alpha_1,\alpha_2\) 等价

再作线性组合 \(\beta_3=\alpha_3+k_1\beta_1+k_2\beta_2\),分别令 \(\langle \beta_3,\beta_1 \rangle=0,\langle \beta_3,\beta_2 \rangle=0\) ,解得

\[k_1=-\frac{\langle \alpha_3,\beta_1 \rangle}{\langle \beta_1,\beta_1 \rangle}, k_2=-\frac{\langle \alpha_3,\beta_2 \rangle}{\langle \beta_2,\beta_2 \rangle} \]

于是得到

\[\beta_3=\alpha_3 -\frac{\langle \alpha_3,\beta_1 \rangle}{\langle \beta_1,\beta_1 \rangle}\beta_1 -\frac{\langle \alpha_3,\beta_2 \rangle}{\langle \beta_2,\beta_2 \rangle}\beta_2 \tag{5.9} \]

这样 \(\beta_1,\beta_2,\beta_3\) 两两正交,且与 \(\alpha_1,\alpha_2\alpha_3\) 等价

同样的方式一直做下去,直到

\[\beta_m=\alpha_m- -\frac{\langle \alpha_m,\beta_1 \rangle}{\langle \beta_1,\beta_1 \rangle}\beta_1 -\frac{\langle \alpha_m,\beta_2 \rangle}{\langle \beta_2,\beta_2 \rangle}\beta_2 -\cdots -\frac{\langle \alpha_m,\beta_{m-1} \rangle}{\langle \beta_{m-1},\beta_{m-1} \rangle} \tag{5.10} \]

这样即得到与 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 等价的正交向量组 \(\beta_1,\beta_2,\cdots,\beta_m\)

进一步,将上述正交向量组 \(\beta_1,\beta_2,\cdots,\beta_m\)单位化,令

\[\gamma_i=\frac{\beta_i}{\left\| \beta_i \right\|},i=1,\cdots,m \tag{5.11} \]

得到与 \(\alpha_1,\alpha_2,\cdots,\alpha_m\) 等价的正交规范向量组 \(\gamma_1,\gamma_2,\cdots,\gamma_m\),整个过程称为正交规范化

式(5.8)的几何解释是:已知 \(\alpha_1,\alpha_2\) 线性无关但不正交。显然二者不在同一直线上,假定 \(\alpha_1,\alpha_2\) 的夹角 \(\varphi\) 为锐角(图5.1,\(\varphi\) 为钝角的情况类似)。先取 \(\beta_1=\alpha_1\) 然后将 \(\alpha_2\) 做一个正交分解(比如物理学中经常把力或速度等向量分解为两个相互垂直的向量),将其分解为跟 \(\alpha_1\) 平行的向量 \(k\alpha_1\) 和跟 \(\alpha_1\) 垂直的向量 \(\beta2\),即

\[\alpha_2=k\alpha_1+\beta_2 \]

其中 \(k\alpha_1\),中的数因子 \(k\) 等于多少呢?注意到 \(k\alpha_1\) 可以看作向量 \(\alpha_2\)\(\alpha_1\) 上的投影,因此其长度为 \(\left\| \alpha_2 \right\| \cdot cos\varphi\),而 \(\alpha_1\) 方向上的单位向量为 \(\frac{\alpha_1}{\left\| \alpha_1 \right\|}\),所以

\[k\alpha_1 =\left\| \alpha_2 \right\| \cdot cos\varphi \cdot \frac{\alpha_1}{\left\| \alpha_1 \right\|} =\left\| \alpha_2 \right\| \cdot \frac{\langle \alpha_2,\alpha_1 \rangle}{\left\| \alpha_2 \right\| \cdot \left\| \alpha_1 \right\|} \cdot \frac{\alpha_1}{\left\| \alpha_1 \right\|} =\frac{\langle \alpha_2,\alpha_1 \rangle}{\langle \alpha_1,\alpha_1 \rangle}\alpha_1 \]

image-20220731173916629

定义12:\(R^n\) 的一个基 \(\alpha_1,\alpha_2,\cdots,\alpha_n\) 是一个正交向量组,则称它们是 \(R^n\) 的一个正交基,进一步,如果 \(\alpha_1,\alpha_2,\cdots,\alpha_n\) 是标准正交向量组,则称它们是 \(R^n\) 的一个标准正交基

第三节 线性方程组的解空间

一、齐次方程组的基础解系

齐次其次方程组 \(AX=0\) 的解向量集合记作

\[X_A=\{X|X\in R^n,AX=0\} \tag{5.12} \]

由于 \(\overline{A}=\begin{pmatrix}\begin{array}{c:c}A & 0\end{array}\end{pmatrix}\),故恒有 \(\overline{r}=R(\overline{A})=R(A)=r\),也就是说,其次方程组必定有解,因此解集 \(X_A\) 非空,对于解集 \(X_A\) 的秩,有如下的重要定理

定理5: 对于 \(n\) 元齐次线性方程组 \(AX=0\),系数矩阵的秩和解集的秩满足

\[R(A)+R(X_A)=n \tag{5.13} \]


个人补充:系数矩阵缺少的维数 \(n - R(A)\) 就是不确定的维度数量,\(X_A\) 可以在这些维度上任意取值,因此构成维度为 \(n-R(A)\)的向量空间

讲义补充

\(R(X_A)\)

  1. 线性无关解向量的个数

  2. 未知数中自由变量的个数


证明: 设 \(R(A)=r(r\leq n)\) 不失一般性假设齐次方程组 \(AX=0\) 经同解变形得到如下最简形式(即系数矩阵的行最简形所对应的方程组)

\[\begin{cases} x_1 & & & +d_{1,r+1}x_{r+1} + \cdots+d_{1n}x_n=0&\\ &\ddots & & \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\cdots&,\\ & &x_r& +d_{1,r+1}x_{r+1} + \cdots+d_{rn}x_n=0&\\ \end{cases} \]

此方程组有 \(r\) 个方程独立,有 \(n-r\) 个自由未知量可以转换为自有参数,移项并补齐得

\[\begin{cases} x_1 &= -d_{1,r+1}x_{r+1}-\cdots-d_{1n}x_n\\ \vdots &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\\ x_r &= -d_{r,r+1}x_{r+1}-\cdots-d_{rn}x_n,\\ x_{r+1} &= x_{r+1}\\ \vdots &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots\cdots\\ x_n &= x_n \end{cases} \]

把上式写成向量形式为

\[\begin{pmatrix} x_1\\ \vdots\\ x_r\\ x_{r+1}\\ \vdots\\ x_n \end{pmatrix} = \begin{pmatrix} -d_{1,r+1}\\ \vdots\\ -d_{r,r+1}\\ 1\\ \vdots\\ 0 \end{pmatrix}t_1+\cdots+ \begin{pmatrix} -d_{1,n}\\ \vdots\\ -d_{r,n}\\ 1\\ \vdots\\ 0 \end{pmatrix}t_{n-r}, \ \ \ \ t_i\in R \ \ (i=1,\cdots,n-r) \]

可记作

\[X=t_1\xi_1+\cdots+t_{n-r}\xi_{n-r},\ \ \ t_i\in R,\ (i=1,\cdots,n-r) \tag{5.14} \]

式中的向量组 \(\xi_1,\cdots,\xi_{n-r}\) 显然线性无关(这只要看它们的后 \(n-r\) 个分量就清楚了);同时,式(5.14)表明方程组所有的解都可以由 \(\xi_1,\cdots,\xi_{n-r}\) 线性表示,故这组向量就是解集 \(X_A\) 的一个极大无关组,因此 \(R(X_A)=n-r=n-R(A)\),即式(5.13)成立。

定义13: 齐次线性方程组 \(AX=0\) 的解集 \(X_A\) 的一个极大无关组 \(\xi_1,\cdots,\xi_{n-r}\) 称为 \(AX=0\) 的一个基础解系。式(5.14)为该方程组的一般通解形式

\(X_A\) 也可以表示为基础解系的线性组合的形式:

\[X_A=\{x=t_1\xi_1+\cdots+t_{n-r}\xi_{n-r}|t_i\in R,\ i=1,\cdots,n-r\} \]

特别若 \(r=n\),方程组只有唯一零解,从而 \(X_A={0}\)。此时 \(AX=0\) 没有基础解系,因此 \(R(X_A)=0\),亦满足 \(R(X_A)+R(A)=n\)

二、齐次线性方程组的解空间

\(m \times n\)齐次线性方程组 \(AX=0\) ,它的解集记作

\[x_A=\{X|X\in R^n\,AX=0\} \tag{5.16} \]

对于齐次线性方程组 \(AX=0\),其解有如下性质

性质1:\(AX_1=0,AX_2=0\),则 \(A(X_1+X_2)=0\)

性质2:\(AX_1=0(k\neq 0)\),则 \(A(kX_1)=0\)

由性质1和性质2,根据向量空间的定义,易知 \(X_A\) 构成一个向量空间,称它为方程组 \(AX=0\) 的解空间。当 \(R(A)=r\) 时,解空间 \(X_A\) 的维数为 \(n-r\),它的一组基础解系 \(\xi_1,\cdots,\xi_{n-r}\) 即为解空间的一组基

三、非齐次线性方程组的解集

非齐次线性方程组 \(AX=\beta\) 有解时,将它的所有解向量构成的集合记作

\[X_{\overline{A}}=\{X|X\in R^n,AX=\beta\} \tag{5.17} \]

称为这个非齐次线性方程组的解集

非齐次线性方程组 \(AX=\beta(\beta\neq 0)\) 对应的齐次方程组 \(AX=0\) 长长被称为它的导出方程组(简称导出组

性质1:\(AX_1=\beta,AX_2=\beta\),则 \(A(X_1-X_2)=0\)

性质1:\(AX_1=\beta,AX=0\),则 \(A(X_1+X)=\beta\)

定理6:\(m \times n\) 线性方程组 \(AX=\beta\) 有解,若导出组 \(AX=0\) 的基础解系为 \(\xi_1,\cdots,\xi_{n-r}\),而 \(\eta\)\(AX=\beta\) 的一特解,则 \(AX=\beta\) 的通解为

\[X=\eta+t_1\xi_1+\cdots+t_{n-r}\xi_{n-r},\ \ \ (t_i\in R,\ i=1,\cdots,n-r) \tag{5.18} \]

第六章 矩阵的相似变换

第一节 方阵的特征值和特征向量

一、特征值和特征向量

定义1:\(A\)\(n\) 阶方阵,如果存放数 \(\lambda\)\(n\) 维非零向量 \(X\) 使关系式

\[AX=\lambda X \tag{6.1} \]

成立,则称数 \(\lambda\) 为方阵 \(A\)特征值;非零列向量 \(X\) 称为 \(A\) 对应于特征值 \(\lambda\)特征向量

将式(6.1)改写成

\[(A-\lambda E)X=0 \tag{6.2} \]

将式(6.2)看成关于X的齐次线性方程组,它有非零解当且仅当其系数行列式满足

\[|A-\lambda E|=0 \tag{6.3} \]

\[\left| \begin{matrix} a_{11}-\lambda & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22}-\lambda & \cdots & a_{2n}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}-\lambda\\ \end{matrix} \right|=0 \tag{6.4} \]

这是以 \(\lambda\) 为未知数的一元 \(n\) 次方程,称为 \(A\)特征方程,其左端 \(|A-\lambda E|\)\(\lambda\)\(n\) 次多项式,记作\(f(\lambda)\),称为 \(A\)特征多项式,特征方程的根就是 \(A\) 的特征值。根据代数基本定理,在复数范围内, \(n\) 阶方阵 \(A\)\(n\) 个特征值(重根按重数计算),记作 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)

求出特征值 \(\lambda_i\) 后,将 \(\lambda_i\) 代入齐次线性方程组(6.2)中,求解方程组

\[(A-\lambda_iE)X=0 \tag{6.5} \]

的所有非零解向量,就是属于 \(\lambda_i\) 的特征向量。对于不同的特征向量逐个计算,可旧的属于各个特征值的全部特征向量。

若非零向量 \(X\) 是方阵 \(A\) 的特征向量,则由式(6.1)可知,对任意实数 \(k \neq 0\) .有

\[A(kX)=\lambda(kX) \tag{6.6} \]

这表明 \(kX\) 也是方阵 \(A\) 的特征向量,因此属于同一特征值的特征向量有无穷多个;反之,不同特征值对应的特征向量必不相同,即一个特征向量只能属于一个特征值。

定理1:\(\lambda\) 是方阵 \(A\) 的特征值,\(p_1,p_2,\cdots,p_s\) 是属于 \(\lambda\) 的特征向量,则 \(p_1,p_2,\cdots,p_s\) 的任意非零线性组合仍是属于 \(\lambda\) 的特征向量。


讲义补充

\(A=(a_ij)\) 是3阶矩阵,则

\[\left | A-\lambda E \right | = \left | \begin{matrix} a_{11} - \lambda & a_{12} & a_{13}\\ a_{21} & a_{22} - \lambda & a_{23}\\ a_{31} & a_{32} & a_{33} - \lambda\\ \end{matrix} \right | =\lambda^3-\sum{a_{ii}}\lambda^2 + S_2\lambda-|A| \]

其中 \(S_2=\left | \begin{matrix} a_{11} & a_{12}\\ a_{21} & a_{22}\\ \end{matrix} \right | +\left | \begin{matrix} a_{11} & a_{13}\\ a_{31} & a_{33}\\ \end{matrix} \right | +\left | \begin{matrix} a_{22} & a_{23}\\ a_{32} & a_{33}\\ \end{matrix} \right |\) (通过行列式展开得到)

若秩 \(r(A)=1\),则

\[|A-\lambda E|=\lambda^3-\sum{a_{ii}}\lambda^2=(\lambda - \sum{a_{ii}})\lambda^2 \]

矩阵\(A\) 的特征值是 \(\lambda_1=\sum{a_{ii}},\lambda_2=\lambda_3=0\)

对于 \(n\) 阶矩阵 \(A\),若 \(r(A)=1\),则 \(|A-\lambda E|=\lambda^n-\sum{a_{ii}}\lambda^{n-1}\),矩阵\(A\) 的特征值是 \(\lambda_1=\sum{a_{ii}},\lambda_2=\lambda_3=\cdots=\lambda_n=0\)

\(\boldsymbol{A}\) \(k\boldsymbol{A}+\boldsymbol{E}\) \(\boldsymbol{A}+k\boldsymbol{E}\) \(\boldsymbol{A}^{-1}\) \(\boldsymbol{A}^*\) \(\boldsymbol{A}^n\) \(\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}\)
\(\lambda\) \(k\lambda+1\) \(\lambda + k\) \(\frac{1}{\lambda}\) \(\frac{|\boldsymbol{A}|}{\lambda}\) \(\lambda^n\) \(\lambda\)
\(\boldsymbol{\alpha}\) \(\boldsymbol{\alpha}\) \(\boldsymbol{\alpha}\) \(\boldsymbol{\alpha}\) \(\boldsymbol{\alpha}\) \(\boldsymbol{\alpha}\) \(\boldsymbol{P}^{-1}\boldsymbol{\alpha}\)

二、特征值与特征向量的性质

定理2:\(\lambda_1,\lambda_2,\cdots,\lambda_n\)\(n\) 阶方阵 \(A=(A_{ij})\)\(n\) 个特征值,则有

  1. \(\sum_{i=1}^n\lambda_i=\sum_{i=1}^na_{ii}\)
  2. \(\prod_{i=1}^n\lambda_i=|A|\)

其中 \(\sum_{i=1}^na_{ii}\)\(A\) 的主对角元之和,称为方阵 \(A\) 的迹,记作 \(tr(A)\)

定理3:\(\lambda\) 是方阵 \(A\) 的特征值,\(p\)\(A\) 的属于 \(\lambda\) 的任一特征向量,则有:

  1. \(\forall k \in R\)\(k\lambda\)\(kA\) 的特征值,\(p\)\(kA\) 的属于 \(k\lambda\) 的特征向量

  2. 对任意非负整数 \(k\)\(\lambda^k\)\(A^k\) 的特征值,\(p\)\(A^k\) 的属于 \(\lambda^k\) 的特征向量

  3. \(\varphi(A)\)\(A\)\(m\)\(m\) 为任意非负整数)次多项式,即

    \[\varphi(A)=a_0E+a_1A+\cdots+a_mA^m \]

    \(\varphi(\lambda)\)\(\varphi(A)\) 的特征值,\(p\)\(\varphi(A)\) 的属于 \(\varphi(\lambda)\) 的特征值

  4. \(A\) 可逆,则 \(\lambda \neq 0\),且 \(\frac{1}{\lambda}\)\(A^{-1}\) 的特征值,\(p\)\(A^{-1}\) 的属于 \(\frac{1}{\lambda}\) 的特征向量

  5. \(A\) 可逆,则 \(\frac{|A|}{\lambda}\)\(A^*\) 的特征值,\(p\)\(A^*\) 的属于 \(\frac{|A|}{\lambda}\) 的特征向量

  6. \(\lambda\) 也是 \(A^T\) 的特征值

定理4: 不同的特征值对应的特征向量线性无关

第二节 相似矩阵

一、相似矩阵的概念与性质

定义2:\(A,B\) 均是 \(n\) 阶方阵,如果存在 \(n\) 阶可逆矩阵 \(P\),满足

\[P^{-1}AP=B \tag{6.10} \]

则称 \(A\)\(B\) 相似,或 \(B\)\(A\)相似矩阵,记作\(A\sim B\),可逆矩阵 \(P\) 称为把 \(A\) 相似变换\(B\)相似变换矩阵

由定义可知, \(P^{-1}AP\) 表示对 \(A\) 作了一系列的初等行变换和初等列变换,而且这一系列初等行变换和初等列变换对应的矩阵互逆,因此矩阵的相似关系是矩阵等价关系的特殊情形

\(A,B,C\) 为同阶方阵,则有

  1. 反身性:\(A\sim A\)
  2. 对称性:若 \(A\sim B\),则 \(B\sim A\)
  3. 传递性:若 \(A\sim B,B\sim C\),则 \(A\sim C\)

讲义补充

\(A\alpha=\lambda\alpha\),则 \(B(P^{-1}\alpha) = P^{-1}A\alpha=\lambda(P^{-1}\alpha)\)

\(B\alpha=\lambda\alpha\),则 \(A(P\alpha)=PB\alpha=\lambda(P\alpha)\)


定理5:\(A\sim B\) ,变换阵为 \(P\) ,则

  1. \(\forall k \in R,kA\sim kB\),变换阵仍为 \(P\)
  2. 任意正整数 \(k\)\(A^k\sim B^k\),变换阵仍为 \(P\)
  3. \(\varphi(A)\sim\varphi(B)\)\(\varphi(\cdot)\)为任意矩阵多项式),变换阵仍为 \(P\)
  4. \(A^T\sim B^T\),变换阵仍为 \((P^T)^{-1}\)
  5. \(A\) 可逆,则 \(B\) 也可逆,且 \(A^{-1}\sim B^{-1},A^*\sim B^*\),变换阵仍为 \(P\)

定理6:\(A \sim B\),则

  1. \(R(A)=R(B)\)
  2. \(A\)\(B\) 有相同的特征值
  3. \(|A|=|B|,tr(A)=tr(B)\)

推论:\(A\) 与对角阵 \(\Lambda=diag(\lambda_1,\cdots,\lambda_n)\) 相似,则 \(\lambda_1,\cdots,\lambda_n\) 就是 \(A\)\(n\) 个特征值


讲义补充:

\(A \sim B \Leftrightarrow \exist\) 可逆 \(P\) 使得 \(P^{-1}AP=B\)

\(\boldsymbol{P}^{-1}(\boldsymbol{A}+k\boldsymbol{E})\boldsymbol{P}=\boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}+\boldsymbol{P}^{-1}k\boldsymbol{E}\boldsymbol{P}=\boldsymbol{B}+k\boldsymbol{E}\)

\(\boldsymbol{A} \sim \boldsymbol{B}\)

\(\Rightarrow \boldsymbol{A}+k\boldsymbol{E} \sim \boldsymbol{B}+k\boldsymbol{E}\)

\(\Rightarrow |\boldsymbol{A}+k\boldsymbol{E}| = |\boldsymbol{B}+k\boldsymbol{E}|\)

\(\Rightarrow r(\boldsymbol{A}+k\boldsymbol{E}) = r(\boldsymbol{B}+k\boldsymbol{E})\)

\(\Rightarrow \lambda_{\boldsymbol{A}+k\boldsymbol{E}} = \lambda_{\boldsymbol{B}+k\boldsymbol{E}}\)


二、矩阵的对角化

定义3: 若存在可逆矩阵 \(P\) 和对角阵 \(\Lambda=diag(\lambda_1,\cdots,\lambda_n)\),使 \(P^{-1}AP=\Lambda\) 成立,则称 \(A\) 可对角化,称 \(\Lambda\)\(A\)相似标准形

定理7: \(n\) 阶方阵 \(A\) 可对角化的充分必要条件是 \(A\)\(n\) 个线性无关的特征向量.

推论:\(n\) 阶方阵 \(A\)\(n\) 个不同的特征值,则 \(A\) 一定可以对角化.

定理8:\(n\) 阶方阵 \(A\) 的所有互异特征值为 \(\lambda_1,\cdots,\lambda_s\),对应重数依次为 \(n_1,\cdots,n_s\),则 \(A\) 可对角化当且仅当 \(R(A-\lambda_iE)=n-n_i\ ,i=1,\cdots,s\) ,即对应于 \(A\) 的每个特征值的线性无关的特征向量的个数恰好等于该特征值的重数.


讲义补充

\(A\) 可相似对角化

\(A \sim \Lambda \Leftrightarrow \exist\) 可逆矩阵 \(P\) 使 \(P^{-1}AP=\Lambda\)

\[\begin{align} AP&=P\Lambda\\ A(\gamma_1\ \gamma_2\ \gamma_3)&=(\gamma_1\ \gamma_2\ \gamma_3)\begin{pmatrix} a_1 & 0 & 0\\ 0 & a_2 & 0\\ 0 & 0 & a_3\\ \end{pmatrix}\\ (A\gamma_1\ A\gamma_2\ A\gamma_3)&=(a_1\gamma_1\ \ a_2\gamma_2\ \ a_3\gamma_3) \end{align} \]

所以 \(A\gamma_1=a_1\gamma_1,A\gamma_2=a_2\gamma_2,A\gamma_3=a_3\gamma_3\)

\(A\) 的特征值:\(a_1,a_2,a_3\)

\(A\) 的特征向量:\(\gamma_1,\gamma_2,\gamma_3\),即 \(P\) 的列向量

因为 \(P\) 可逆,所以 \(\gamma_1,\gamma_2,\gamma_3\) 线性无关,所以可对角化的矩阵拥有n个线性无关的特征向量,即本章的定理7必要性的证明

判断是否可以对角化:

\(A \sim \Lambda\Leftrightarrow A\)\(n\) 个无关的特征向量

\(A\)\(n\) 个不同的特征值 \(\Rightarrow A\)\(n\) 个无关的特征向量

\(A^T=A\Rightarrow A\)\(n\) 个无关的特征向量

\(A\)\(n\) 个无关的特征向量 \(\Leftrightarrow\)\(\lambda_i\)\(k\) 重特征值,那么 \(\lambda_i\)\(k\) 个无关的特征向量 \(\Leftrightarrow r(\lambda_iE-A)=n-k\)


第三节 实对称矩阵的对角化

一、实对称矩阵特征值与特征向量

定理9: 实对称矩阵的特征值全是实数,也必有实特征向量.

定理10: 实对称矩阵属于不同特征值的特征向量一定正交.

定理11:\(A\)\(n\) 阶实对称矩阵,\(\lambda_i\)\(A\)\(n_i\) 重特征值,则 \(R(A-\lambda_iE)=n-n_i\),从而特征值 \(\lambda_i\) 恰有 \(n_i\) 个线性无关的特征向量.

二、正交矩阵

定义4:\(n\) 阶方阵 \(A\) 满足 \(A^TA=E\),则称 \(A\)正交矩阵,简称正交阵.


讲义补充

\[A^TA=\begin{pmatrix} a_1 & a_2 & a_3\\ b_1 & b_2 & b_3\\ c_1 & c_2 & c_3\\ \end{pmatrix} \begin{pmatrix} a_1 & b_1 & c_1\\ a_2 & b_2 & c_2\\ a_3 & b_3 & c_3\\ \end{pmatrix} = \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\ \end{pmatrix} \]

可得

\[a_1^2+a_2^2+a_3^2=1\\ a_1b_1+a_2b_2+a_3b_3=0\\ a_1c_1+a_2c_2+a_3c_3=0 \]

即向量 \((a_1,a_2,a_3)^T\) 与 向量 \((b_1,b_2,b_3)^T,(c_1,c_2,c_3)^T\) 正交,且其长度为1。

从集合上来看,矩阵 \(A^T\) 的列向量可以构成一个直角坐标系


定理12: 正交阵A具有以下性质:

  1. \(A^{-1}=A^T\)也是正交阵;
  2. \(|A|=\pm1\)
  3. \(B\) 也是正交阵,则\(AB\)也是正交阵;
  4. \(A\) 的行(列)向量组构成 \(R^n\) 的一个标准正交基.

定义5:\(A\) 为正交阵,则向量的线性变换 \(y=Ax\) 称为正交变换.

三、实对称矩阵的对角化

定理13:\(A\)\(n\) 阶实对称阵,则必有正交矩阵 \(P\),使得 \(P^{-1}AP=\Lambda\),其中 \(\Lambda\) 是以 \(A\)\(n\) 个特征值为对角元的对角阵。即实对称矩阵必可经过正交变换对角化.

posted @ 2022-08-01 21:35  Un-Defined  阅读(3297)  评论(0编辑  收藏  举报