线性代数及其应用 第三章

第 3 章 行列式

3.1 行列式简介

我们研究如何将 \(2\times 2\) 矩阵的行列式推广至 \(n\times n\)

考虑 \(3\times 3\) 可逆矩阵 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\)\(a_{11}\ne0\),将其行化简得到一个上三角矩阵,其 \((3,3)\) 元素为 \(a_{11}\Delta\),其中

\[\Delta=a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33}-a_{13}a_{22}a_{31} \]

\(\Delta\ne0\),称 \(\Delta\)\(3\times 3\) 矩阵 \(\bm A\)行列式

注意到

\[\begin{aligned}\Delta &= (a_{11}a_{22}a_{33}-a_{11}a_{23}a_{32})-(a_{12}a_{21}a_{33}-a_{12}a_{23}a_{31})+(a_{13}a_{21}a_{32}-a_{13}a_{22}a_{31}) \\ &= a_{11}\cdot\mathrm{det}\begin{bmatrix}a_{22}&a_{23}\\a_{32}&a_{33}\end{bmatrix}-a_{12}\cdot\mathrm{det}\begin{bmatrix}a_{21}&a_{23}\\a_{31}&a_{33}\end{bmatrix}+a_{13}\cdot\mathrm{det}\begin{bmatrix}a_{21}&a_{22}\\a_{31}&a_{32}\end{bmatrix} \end{aligned} \]

简单起见,写为

\[\Delta=a_{11}\cdot\mathrm{det}\bm A_{11}-a_{12}\cdot\mathrm{det}\bm A_{12}+a_{13}\cdot\mathrm{det}\bm A_{13} \]

其中 \(\bm A_{ij}\) 表示删去 \(\bm A\) 的第 \(i\) 行和第 \(j\) 行得到的子矩阵。

我们已经给出了行列式的一个递归定义。当 \(n=3\) 时,\(\mathrm{det}\bm A\)\(2\times 2\) 子矩阵的行列式来定义。一般情况下,一个 \(n\times n\) 行列式由 \((n-1)\times (n-1)\) 子矩阵的行列式来定义。

定义 \(\;\)\(n\ge 2\)\(n\times n\) 矩阵 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\)行列式是形如 \(\pm a_{ij}\mathrm{det}\bm A_{ij}\)\(n\) 个项的和,其中加号和减号交替出现,元素 \(a_{11},a_{12},\cdots,a_{1n}\) 来自 \(\bm A\) 的第一行,用符号表示为

\[\begin{aligned}\mathrm{det}\bm A&=a_{11}\cdot\mathrm{det}\bm A_{11}-a_{11}\cdot\mathrm{det}\bm A_{11}+a_{12}\cdot\mathrm{det}\bm A_{12}+\cdots+(-1)^{1+n}a_{1n}\cdot\mathrm{det}\bm A_{1n}\\&=\sum_{j=1}^{n}(-1)^{1+j}a_{1j}\mathrm{det}\bm A_{1j}\end{aligned} \]

方阵的行列式的另一个常用记号是用一对竖线代替括号,例如 \(\mathrm{det}\begin{bmatrix}4&-1\\-2&0\end{bmatrix}=\begin{vmatrix}4&-1\\-2&0\end{vmatrix}\)

给定 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\)\(\bm A\)\((i,j)\) 代数余子式 \(C_{ij}\) 由下式给出:

\[C_{ij}=(-1)^{i+j}\mathrm{det}\bm A_{ij} \]

\[\mathrm{det}\bm A=a_{11}\cdot C_{11}+a_{12}\cdot C_{12}+\cdots+a_{1n}\cdot C_{1n} \]

这个公式称为按 \(\bm A\) 的第一行的代数余子式展开式。

定理 1

\(n\times n\) 矩阵 \(\bm A\) 的行列式可按任意行或列的代数余子式展开式来计算。按第 \(i\) 行的代数余子式展开式为

\[\mathrm{det}\bm A=a_{i1}C_{i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in} \]

按第 \(j\) 列的代数余子式展开式为

\[\mathrm{det}\bm A=a_{1j}C_{1j}+a_{2j}C_{2j}+\cdots+a_{nj}C_{nj} \]

该定理有助于计算包含许多零的矩阵行列式,例如按某行或某列的代数余子式展开式求行列式,可以减少代数余子式的计算(如果前面的系数为 \(0\))。

定理 2

\(\bm A\) 为三角阵,则 \(\mathrm{det}\bm A\) 等于 \(\bm A\) 的主对角线上的元素的乘积。

我们试图确定一个行列式的取值范围。设 \(\bm A\)\(n\times n\) 矩阵,其绝对值最大的 \(n\) 个元素的乘积为 \(p\),显然 \(\det\bm A\in[-np,np]\)

3.2 行列式的性质

定理 3(行变换)

\(\bm A\) 是一个方阵。

\(\text{a}.\)\(\bm A\) 的某一行的倍数加到另一行得矩阵 \(\bm B\),则 \(\det B=\det A\)

\(\text{b}.\)\(\bm A\) 的两行互换得矩阵 \(\bm B\),则 \(\det B=-\det A\)

\(\text{c}.\)\(\bm A\) 的某行乘以 \(k\) 倍得到矩阵 \(\bm B\),则 \(\det B=k\cdot \det A\)

我们将一个初等矩阵 \(\bm E\) 分为行倍加(矩阵)交换\(r\) 倍乘三种情形。我们将其重新叙述为:

\(\bm A\)\(n\times n\) 矩阵,\(\bm E\)\(n\times n\) 初等矩阵,则

\[\det\bm E\bm A=(\det\bm E)(\det\bm A) \]

其中

\[\det\bm E=\begin{cases}1&若\bm E是一个行倍加 \\ -1&若\bm E是一个交换\\ r&若\bm E是一个r倍乘\end{cases} \]

考虑归纳。这显然对 \(1\times 1\)\(2\times 2\) 矩阵成立。于是对于 \(k\ge 2\),令 \(n=k+1\),将其从 \(k\times k\) 推广至 \(n\times n\)

\(\bm E\)\(\bm A\) 的作用涉及一行或两行。按在 \(\bm E\) 的作用下未被改变的一行展开 \(\det\bm B\)\(\bm B=\bm E\bm A\)(设为第 \(i\) 行)。那么 \(\bm B_{ij}\) 的行由 \(\bm A_{ij}\) 的行通过实行与 \(\bm E\) 作用于 \(\bm A\) 相同类型的初等行变换得到。由于这些子矩阵为 \(k\times k\) 矩阵,故此归纳假设蕴涵

\[\det B_{ij}=\alpha\cdot\det\bm A_{ij} \]

其中 \(\alpha=1,-1\)\(r\)。按第 \(i\) 行的代数余子式展开式得到

\[\begin{aligned}\det\bm E\bm A&=a_{i1}(-1)^{i+1}\det\bm B_{i1}+\cdots+a_{in}(-1)^{i+n}\det\bm B_{in} \\ &=\alpha\cdot a_{i1}(-1)^{i+1}\det\bm A_{i1}+\cdots+\alpha\cdot a_{in}(-1)^{i+n}\det\bm A_{in} \\ &=\alpha\cdot\det\bm A\end{aligned} \]

得证。

于是我们能利用定理 3 方便地计算矩阵的行列式。

若方阵 \(\bm A\) 通过行倍加和行交换化简为阶梯形 \(\bm U\),其中经过了 \(r\) 次行交换,则

\[\det\bm A=(-1)^r\det \bm U \]

\(\bm U\) 是三角形的,\(\bm A\) 可逆等价于 \(\bm U\) 主对角线元素均非零,于是

\[\det\bm A=\begin{cases}(-1)^r\cdot(\bm U的主元乘积) &当\bm A可逆\\ 0 &当 \bm A不可逆\end{cases} \]

尽管阶梯形 \(\bm U\) 是不唯一的,但这些主元的乘积的绝对值是唯一的。该公式给出 \(\det\bm A\) 的一个具体解释,同时证明了如下定理。

定理 4

方阵 \(\bm A\) 是可逆的当且仅当 \(\det\bm A\ne0\)

该定理将语句“\(\det\bm A\ne0\)” 增加到可逆矩阵定理中。

一个有用的推论是,若 \(\bm A\) 的列线性相关,则 \(\det\bm A=0\)。且若 \(\bm A\) 的行线性相关,则 \(\det\bm A=0\)。(因为 \(\bm A^T\) 是奇异的,由可逆矩阵定理知 \(\bm A\) 是奇异的。)

数值计算

\(1.\) 对一般矩阵 \(\bm A\),许多计算 \(\det\bm A\) 的计算机程序使用上述公式的方法。

\(2.\) 用行变换计算一个 \(n\times n\) 行列式大约需要 \(2n^2/3\) 次算术运算。

列变换

考虑证明行列式的列变换与行变换具有相同的效果。

(注意数学归纳原理表述为:令 \(P(n)\) 对每个自然数 \(n\) 成立或不成立。假设 \(P(1)\) 成立,则 \(P(n)\) 对所有 \(n\ge 1\) 的情形成立。对每个自然数 \(k\),若 \(P(k)\) 成立,则 \(P(k+1)\) 成立。)

定理 5

\(\bm A\) 为一个 \(n\times n\) 矩阵,则 \(\det\bm A^T=\det\bm A\)

考虑归纳。设该定理对 \(k\times k\) 矩阵成立,且 \(n=k+1\)。则 \(\bm A\)\(a_{1j}\) 的代数余子式等于 \(\bm A^T\)\(a_{j1}\) 的代数余子式。所以 \(\det\bm A\) 按第一行的代数余子式展开式等于 \(\det\bm A^T\) 沿第一列的代数余子式展开式。容易得证。

于是将定理 3 中的“行”换成“列”时,定理 \(3\) 中每一个命题均成立。

行列式与矩阵乘积

定理 6(乘法的性质)

\(\bm A\)\(\bm B\) 均为 \(n\times n\) 矩阵,则 \(\det\bm A\bm B=(\det\bm A)(\det\bm B)\)

我们记 \(\det\bm A\)\(|\bm A|\)

首先若 \(\bm A\) 不可逆,则 \(\bm A\bm B\) 不可逆。这是因为若 \(\bm B\) 可逆,\(\bm A\bm B\sim\bm A\);若 \(\bm B\) 不可逆,\(\bm A\bm B\bm x=\bm0\) 有非平凡解。此时 \(\det\bm A=\det\bm A\cdot \det\bm B\) 均为零,是成立的。

\(\bm A\) 可逆,存在初等矩阵 \(\bm E_1,\bm E_2,\cdots,\bm E_p\) 使得 \(\bm A=\bm E_p\bm E_{p-1}\cdots\bm E_1\),使用定理 3 可得

\[\begin{aligned}|\bm A\bm B|&=|\bm E_P\bm E_{p-1}\cdots\bm E_1\bm B|=|\bm E_p|\cdot|\bm E_{p-1}\cdots\bm E_1\bm B|\\&=|\bm E_p||\bm E_{p-1}|\cdots|\bm E_1||\bm B|=\cdots=|\bm E_p\bm E_{p-1}\cdots\bm E_1||B|\\&=|\bm A||\bm B|\end{aligned} \]

得证。

行列式函数的一个线性性质

对于 \(n\times n\) 矩阵 \(\bm A\),可将 \(\det\bm A\) 视为 \(\bm A\)\(n\) 个列向量的函数。若只改变某一列的向量,则 \(\det\bm A\) 是该可变列向量的线性函数

假设 \(\bm A\) 的第 \(j\) 列有变化,使得

\[\bm A=\begin{bmatrix}\bm a_1&\bm a_2&\cdots&\bm a_{j-1}&\bm x&\bm a_{j+1}&\cdots&\bm a_n\end{bmatrix} \]

定义由 \(\mathbb{R}^n\)\(\mathbb{R}\) 的变换 \(T\)

\[T(\bm x)=\det\begin{bmatrix}\bm a_1&\bm a_2&\cdots&\bm a_{j-1}&\bm x&\bm a_{j+1}&\cdots&\bm a_n\end{bmatrix} \]

则对于任意常数 \(c\)\(\mathbb{R}^n\) 中任意 \(\bm x,\bm u,\bm v\),有

\[T(c\bm x)=cT(\bm x) \]

\[T(\bm u+\bm v)=T(\bm u)+T(\bm v) \]

第一个使用定理 3c 即可。第二个可由按第 \(j\) 列的代数余子式展开式得到。

3.3 克拉默法则、体积和线性变换

克拉默法则

对任意 \(n\times n\) 矩阵 \(\bm A\) 和任意的 \(\mathbb{R}^n\) 中向量 \(\bm b\),令 \(\bm A_i(\bm b)\) 表示 \(\bm A\) 中第 \(i\) 列由向量 \(\bm b\) 替换得到的矩阵。

定理 7(克拉默法则)

\(\bm A\) 是一个可逆的 \(n\times n\) 矩阵,对 \(\mathbb{R}^n\) 中任意向量 \(\bm b\),方程 \(\bm A\bm x=\bm b\) 的唯一解可由下式给出:

\[x_i=\frac{\det\bm A_i(\bm b)}{\det\bm A},i=1,2,\cdots,n \]

\(\bm e_1,\bm e_2,\cdots,\bm e_n\) 表示 \(\bm I\) 的列。若 \(\bm A\bm x=\bm b\),有

\[\begin{aligned}\bm A\cdot\bm I_i(\bm x)&=\bm A\begin{bmatrix}\bm e_1&\bm e_2&\cdots&\bm x&\cdots&\bm e_n\end{bmatrix}=\begin{bmatrix}\bm A\bm e_1&\bm A\bm e_2&\cdots&\bm A\bm x&\cdots&\bm A\bm e_n\end{bmatrix}\\&=\begin{bmatrix}\bm a_1&\bm a_2&\cdots&\bm b&\cdots&\bm a_n\end{bmatrix}=\bm A_i(\bm b)\end{aligned} \]

由行列式的乘法性质,

\[(\det\bm A)(\det\bm I_i(\bm x))=\det\bm A_i(\bm b) \]

左式的右半部分为 \(x_i\),于是 \((\det\bm A)x_i=\det\bm A_i(\bm b)\)。又 \(\bm A\) 可逆,\(\det\bm A\ne0\),得证。

在工程上的应用

许多工程上的问题(特别是电子工程和控制论)能用拉普拉斯变换进行分析。其将一个适当的线性微分方程组转变为一个线性代数方程组,它的系数含有一个参数。

考虑下列方程组,\(s\) 为未定参数。确定 \(s\) 使得方程组有唯一解并用克拉默法则求出它。

\[\begin{cases}3sx_1&-2x_2&=4\\-6x_1&+sx_2&=1\end{cases} \]


将方程组视为 \(\bm A\bm x=\bm b\) 型,则

\[\bm A=\begin{bmatrix}3s&-2\\-6&s\end{bmatrix}\quad\bm A_i(\bm b)=\begin{bmatrix}4&-2\\1&s\end{bmatrix}\quad\bm A_2(\bm b)=\begin{bmatrix}3s&4\\-6&1\end{bmatrix} \]

\(\det\bm A=3s^2-12=3(s+2)(s-2)\),于是 \(s\ne\pm2\) 时方程组有唯一解,方程组的的解 \((x_1,x_2)\) 满足

\[\begin{cases}\displaystyle x_1=\frac{\det\bm A_1(b)}{\det\bm A}=\frac{4s+2}{3(s+2)(s-2)}\\\displaystyle x_2=\frac{\det\bm A_2(\bm b)}{\det\bm A}=\frac{3s+24}{3(s+2)(s-2)}=\frac{s+8}{(s+2)(s-2)}\end{cases} \]

一个求 \(\bm A^{-1}\) 的公式

\(\bm A^{-1}\) 的第 \(j\) 列是一个向量 \(\bm x\),其满足 \(\bm A\bm x=\bm e_j\)\(\bm x\) 的第 \(i\) 个元素是 \(\bm A^{-1}\) 中的 \((i,j)\) 元素,由克拉默法则,

\[\{A^{-1}中(i,j)元素\}=x_i=\frac{\det\bm A_i(\bm e_j)}{\det\bm A} \]

\(\bm A_i(\bm e_j)\) 按第 \(i\) 列的代数余子式展开式为

\[\det\bm A_i(\bm e_j)=(-1)^{i+j}\det\bm A_{ji}=C_{ji} \]

于是 \(\bm A^{-1}\)\((i,j)\) 元素等于代数余子式 \(C_{ji}\) 除以 \(\det\bm A\)。那么

\[\bm A^{-1}=\frac{1}{\det\bm A}\begin{bmatrix}C_{11}&C_{21}&\cdots&C_{n1}\\C_{12}&C_{22}&\cdots&C_{n2}\\\vdots&\vdots&\ddots&\vdots\\C_{1n}&C_{2n}&\cdots&C_{nn}\end{bmatrix} \]

右边的代数余子式的矩阵称为 \(\bm A\)伴随矩阵,称为 \(\mathrm{adj}\bm A\)(伴随矩阵是代数余子式的矩阵的转置)。下列定理复述该式。

定理 8(逆矩阵公式)

\(\bm A\) 是一个可逆的 \(n\times n\) 矩阵,则 \(\bm A^{-1}=\dfrac{1}{\det\bm A}\mathrm{adj}\bm A\)

数值计算

定理 8 主要用于理论计算,使得不必计算 \(\bm A^{-1}\) 就能推导其性质。

克拉默法则也是一个理论工具,可以用来研究 \(\bm A\bm x=\bm b\) 的解如何随 \(\bm A\)\(\bm b\) 中元素的变化而变化。对于较小的复数矩阵,行化简 \(\begin{bmatrix}\bm A&\bm b\end{bmatrix}\) 较麻烦,而行列式计算相对简单,故其有时在手算时被选用。然而当 \(n\) 很大时就没有什么作用了。

用行列式表示面积或体积

定理 9

\(\bm A\) 是一个 \(2\times 2\) 矩阵,则由 \(\bm A\) 的列确定的平行四边形的面积为 \(|\det\bm A|\)。若 \(\bm A\) 是一个 \(3\times 3\) 矩阵,则由 \(\bm A\) 的列确定的平行六面体的体积为 \(|\det\bm A|\)

\(2\times 2\) 的是两个向量围成的;\(3\times 3\) 的差不多,长这个样(方便理解):

\(\bm A\)\(2\) 阶对角矩阵,定理显然成立:

\[\Bigg|\det\begin{bmatrix}a&0\\0&d\end{bmatrix}\Bigg|=|ad|=\{矩阵的面积\} \]

\(\bm A\) 不为对角情形,只需证 \(\bm A=\begin{bmatrix}\bm a_1&\bm a_2\end{bmatrix}\) 能变换成一个对角矩阵,变换时不改变相应平行四边形面积和 \(|\det\bm A|\)\(\bm A\) 进行列交换和列倍加操作不改变 \(|\det\bm A|\),而这些运算足以将 \(\bm A\) 变换为对角矩阵。列交换不改变对应平行四边形,我们只需证明以下 \(\mathbb{R}^2\)\(\mathbb{R}^3\) 中的向量的简单几何现象:

  • \(\bm a_1\)\(\bm a_2\) 为非零向量,则对任意数 \(c\),由 \(\bm a_1\)\(\bm a_2\) 确定的平行四边形的面积等于由 \(\bm a_1\)\(\bm a_2+c\bm a_1\) 确定的平行四边形的面积。

这个是比较浅显的:考虑 \(\bm a_2+c\bm a_1\) 对应的点到直线 \(\bm a_1\) 的距离不变即可。对于 \(\mathbb{R^3}\) 的话就是面。

于是 \(2\times 2\) 的情况得证。


定理对 \(3\times 3\) 对角阵 \(\begin{bmatrix}a&0&0\\0&b&0\\0&0&c\end{bmatrix}\) 显然成立。任意一个 \(3\times 3\) 矩阵均可用不改变 \(|\det\bm A|\) 的列变换变换为对角矩阵,而如前面所述,向量 \(\bm a_2+c\bm a_1\)\(\mathrm{Span}\{\bm a_1,\bm a_3\}\) 的距离不变,平行六面体的体积不变。得证。

线性变换

设集合 \(S\) 在线性变换 \(T\) 的定义域内,用 \(T(S)\) 表示 \(S\) 中点的像集。我们研究 \(T(S)\) 的面积(体积)与原来集合 \(S\) 的面积(体积)的变化。为方便,若 \(S\) 是一个边界为平行四边形的区域,用 \(S\) 表示一个平行四边形。

定理 10

\(T:\mathbb{R}^2\rightarrow\mathbb{R}^2\) 是由一个 \(2\times 2\) 矩阵 \(\bm A\) 确定的线性变换,若 \(S\)\(\mathbb{R}^2\) 中一个平行四边形,则

\[\{T(S)的面积\}=|\det\bm A|\cdot\{S的面积\} \]

\(T\) 是一个由 \(3\times 3\) 矩阵 \(\bm A\) 确定的线性变换,而 \(S\)\(\mathbb{R}^3\) 中的一个平行六面体,则

\[\{T(S)的体积\}=|\det\bm A|\cdot\{S的体积\} \]

考虑 \(2\times 2\) 的情形。一个顶点为 \(\mathbb{R}^2\) 中原点的平行四边形由向量 \(\bm b_1\)\(\bm b_2\) 确定,有如下形式:

\[S=\{s_1\bm b_1+s_2\bm b_2:0\le s_1\le 1,0\le s_2\le 1\} \]

\(S\)\(T\) 下的像由以下形式的点组成:

\[T(s_1\bm b_1+s_2\bm b_2)=s_1\bm A\bm b_1+s_2\bm A\bm b_2 \]

所以 \(T(S)\) 是一个由矩阵 \(\begin{bmatrix}\bm A\bm b_1&\bm A\bm b_2\end{bmatrix}\) 的列确定的平行四边形,可以将该矩阵写为 \(\bm A\bm B\)\(\bm B=\begin{bmatrix}\bm b_1&\bm b_2\end{bmatrix}\)。由定理 9 和行列式的乘积定理,

\[\begin{aligned}\{T(S)的面积\}&=|\det\bm A\bm B|=|\det\bm A||\det\bm B| \\ &=|\det\bm A|\cdot\{S的面积\}\end{aligned} \]

任意平行四边形具有形式 \(\bm p+S\)\(\bm p\) 为一向量,\(S\) 同上。由于平移不改变集合面积,有

\[\begin{aligned}\{T(\bm p+S)的面积\} &= \{T(\bm p)+T(S)的面积\} \\ &= \{T(S)的面积\} \\ &= |\det\bm A|\cdot\{S的面积\} \\ &=|\det\bm A|\cdot\{(\bm p+S)的面积\}\end{aligned} \]

\(3\times 3\) 的情形类似。得证。

若尝试把定理 10 推广至 \(\mathbb{R}^2\)\(\mathbb{R}^3\) 中不是由直线或平面所围的区域时,可以用微分思想将其划分为若干平行四边形或平行六面体,于是有如下结论。

定理 10 的结论对 \(\mathbb{R}^2\) 这种任意具有有限面积的区域或 \(\mathbb{R}^3\) 中具有有限体积的区域均成立。

对正数 \(a,b\),求以方程为 \(\dfrac{x_1^2}{a^2}+\dfrac{x_2^2}{b^2}=1\) 的椭圆为边界的区域 \(E\) 的面积。


可以得到 \(E\) 是单位圆盘 \(D\) 在线性变换 \(T\) 下的像,\(T\) 由矩阵 \(\bm A=\begin{bmatrix}a&0\\0&b\end{bmatrix}\),因为若 \(\bm u,\bm x\in\mathbb{R}^2\),且 \(\bm x=\bm A\bm u\),则

\[u_1=\frac{x_1}{a},u_2=\frac{x_2}{b} \]

那么如果 \(\bm u\) 在单位圆盘内,即 \(u_1^2+u_2^2\le 1\),当且仅当 \(\bm x\)\(E\) 内,即 \((\dfrac{x_1}{a})^2+(\dfrac{x_2}{b})^2\le 1\),由定理 10 的推广,

\[\begin{aligned} \{椭圆的面积\} &=\{T(D)的面积\} \\ &=|\det\bm A|\cdot\{D的面积\} \\ &=\pi ab \end{aligned} \]

posted @ 2024-05-28 21:08  SError  阅读(13)  评论(0编辑  收藏  举报