线性代数及其应用 第三章
第 3 章 行列式
3.1 行列式简介
我们研究如何将 \(2\times 2\) 矩阵的行列式推广至 \(n\times n\)。
考虑 \(3\times 3\) 可逆矩阵 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\),\(a_{11}\ne0\),将其行化简得到一个上三角矩阵,其 \((3,3)\) 元素为 \(a_{11}\Delta\),其中
有 \(\Delta\ne0\),称 \(\Delta\) 为 \(3\times 3\) 矩阵 \(\bm A\) 的行列式。
注意到
简单起见,写为
其中 \(\bm A_{ij}\) 表示删去 \(\bm A\) 的第 \(i\) 行和第 \(j\) 行得到的子矩阵。
我们已经给出了行列式的一个递归定义。当 \(n=3\) 时,\(\mathrm{det}\bm A\) 由 \(2\times 2\) 子矩阵的行列式来定义。一般情况下,一个 \(n\times n\) 行列式由 \((n-1)\times (n-1)\) 子矩阵的行列式来定义。
定义 \(\;\) 当 \(n\ge 2\),\(n\times n\) 矩阵 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\) 的行列式是形如 \(\pm a_{ij}\mathrm{det}\bm A_{ij}\) 的 \(n\) 个项的和,其中加号和减号交替出现,元素 \(a_{11},a_{12},\cdots,a_{1n}\) 来自 \(\bm A\) 的第一行,用符号表示为
\[\begin{aligned}\mathrm{det}\bm A&=a_{11}\cdot\mathrm{det}\bm A_{11}-a_{11}\cdot\mathrm{det}\bm A_{11}+a_{12}\cdot\mathrm{det}\bm A_{12}+\cdots+(-1)^{1+n}a_{1n}\cdot\mathrm{det}\bm A_{1n}\\&=\sum_{j=1}^{n}(-1)^{1+j}a_{1j}\mathrm{det}\bm A_{1j}\end{aligned} \]
方阵的行列式的另一个常用记号是用一对竖线代替括号,例如 \(\mathrm{det}\begin{bmatrix}4&-1\\-2&0\end{bmatrix}=\begin{vmatrix}4&-1\\-2&0\end{vmatrix}\)。
给定 \(\bm A=\begin{bmatrix}a_{ij}\end{bmatrix}\),\(\bm A\) 的 \((i,j)\) 代数余子式 \(C_{ij}\) 由下式给出:
则
这个公式称为按 \(\bm A\) 的第一行的代数余子式展开式。
定理 1
\(n\times n\) 矩阵 \(\bm A\) 的行列式可按任意行或列的代数余子式展开式来计算。按第 \(i\) 行的代数余子式展开式为
\[\mathrm{det}\bm A=a_{i1}C_{i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in} \]按第 \(j\) 列的代数余子式展开式为
\[\mathrm{det}\bm A=a_{1j}C_{1j}+a_{2j}C_{2j}+\cdots+a_{nj}C_{nj} \]
该定理有助于计算包含许多零的矩阵行列式,例如按某行或某列的代数余子式展开式求行列式,可以减少代数余子式的计算(如果前面的系数为 \(0\))。
定理 2
若 \(\bm A\) 为三角阵,则 \(\mathrm{det}\bm A\) 等于 \(\bm A\) 的主对角线上的元素的乘积。
我们试图确定一个行列式的取值范围。设 \(\bm A\) 为 \(n\times n\) 矩阵,其绝对值最大的 \(n\) 个元素的乘积为 \(p\),显然 \(\det\bm A\in[-np,np]\)。
3.2 行列式的性质
定理 3(行变换)
令 \(\bm A\) 是一个方阵。
\(\text{a}.\) 若 \(\bm A\) 的某一行的倍数加到另一行得矩阵 \(\bm B\),则 \(\det B=\det A\)。
\(\text{b}.\) 若 \(\bm A\) 的两行互换得矩阵 \(\bm B\),则 \(\det B=-\det A\)。
\(\text{c}.\) 若 \(\bm A\) 的某行乘以 \(k\) 倍得到矩阵 \(\bm B\),则 \(\det B=k\cdot \det A\)。
我们将一个初等矩阵 \(\bm E\) 分为行倍加(矩阵),交换和 \(r\) 倍乘三种情形。我们将其重新叙述为:
若 \(\bm A\) 是 \(n\times n\) 矩阵,\(\bm E\) 是 \(n\times n\) 初等矩阵,则
\[\det\bm E\bm A=(\det\bm E)(\det\bm A) \]其中
\[\det\bm E=\begin{cases}1&若\bm E是一个行倍加 \\ -1&若\bm E是一个交换\\ r&若\bm E是一个r倍乘\end{cases} \]考虑归纳。这显然对 \(1\times 1\) 和 \(2\times 2\) 矩阵成立。于是对于 \(k\ge 2\),令 \(n=k+1\),将其从 \(k\times k\) 推广至 \(n\times n\)。
\(\bm E\) 对 \(\bm A\) 的作用涉及一行或两行。按在 \(\bm E\) 的作用下未被改变的一行展开 \(\det\bm B\),\(\bm B=\bm E\bm A\)(设为第 \(i\) 行)。那么 \(\bm B_{ij}\) 的行由 \(\bm A_{ij}\) 的行通过实行与 \(\bm E\) 作用于 \(\bm A\) 相同类型的初等行变换得到。由于这些子矩阵为 \(k\times k\) 矩阵,故此归纳假设蕴涵
\[\det B_{ij}=\alpha\cdot\det\bm A_{ij} \]其中 \(\alpha=1,-1\) 或 \(r\)。按第 \(i\) 行的代数余子式展开式得到
\[\begin{aligned}\det\bm E\bm A&=a_{i1}(-1)^{i+1}\det\bm B_{i1}+\cdots+a_{in}(-1)^{i+n}\det\bm B_{in} \\ &=\alpha\cdot a_{i1}(-1)^{i+1}\det\bm A_{i1}+\cdots+\alpha\cdot a_{in}(-1)^{i+n}\det\bm A_{in} \\ &=\alpha\cdot\det\bm A\end{aligned} \]得证。
于是我们能利用定理 3 方便地计算矩阵的行列式。
若方阵 \(\bm A\) 通过行倍加和行交换化简为阶梯形 \(\bm U\),其中经过了 \(r\) 次行交换,则
\(\bm U\) 是三角形的,\(\bm A\) 可逆等价于 \(\bm U\) 主对角线元素均非零,于是
尽管阶梯形 \(\bm U\) 是不唯一的,但这些主元的乘积的绝对值是唯一的。该公式给出 \(\det\bm A\) 的一个具体解释,同时证明了如下定理。
定理 4
方阵 \(\bm A\) 是可逆的当且仅当 \(\det\bm A\ne0\)。
该定理将语句“\(\det\bm A\ne0\)” 增加到可逆矩阵定理中。
一个有用的推论是,若 \(\bm A\) 的列线性相关,则 \(\det\bm A=0\)。且若 \(\bm A\) 的行线性相关,则 \(\det\bm A=0\)。(因为 \(\bm A^T\) 是奇异的,由可逆矩阵定理知 \(\bm A\) 是奇异的。)
数值计算
\(1.\) 对一般矩阵 \(\bm A\),许多计算 \(\det\bm A\) 的计算机程序使用上述公式的方法。
\(2.\) 用行变换计算一个 \(n\times n\) 行列式大约需要 \(2n^2/3\) 次算术运算。
列变换
考虑证明行列式的列变换与行变换具有相同的效果。
(注意数学归纳原理表述为:令 \(P(n)\) 对每个自然数 \(n\) 成立或不成立。假设 \(P(1)\) 成立,则 \(P(n)\) 对所有 \(n\ge 1\) 的情形成立。对每个自然数 \(k\),若 \(P(k)\) 成立,则 \(P(k+1)\) 成立。)
定理 5
若 \(\bm A\) 为一个 \(n\times n\) 矩阵,则 \(\det\bm A^T=\det\bm A\)。
考虑归纳。设该定理对 \(k\times k\) 矩阵成立,且 \(n=k+1\)。则 \(\bm A\) 中 \(a_{1j}\) 的代数余子式等于 \(\bm A^T\) 中 \(a_{j1}\) 的代数余子式。所以 \(\det\bm A\) 按第一行的代数余子式展开式等于 \(\det\bm A^T\) 沿第一列的代数余子式展开式。容易得证。
于是将定理 3 中的“行”换成“列”时,定理 \(3\) 中每一个命题均成立。
行列式与矩阵乘积
定理 6(乘法的性质)
若 \(\bm A\) 和 \(\bm B\) 均为 \(n\times n\) 矩阵,则 \(\det\bm A\bm B=(\det\bm A)(\det\bm B)\)。
我们记 \(\det\bm A\) 为 \(|\bm A|\)。
首先若 \(\bm A\) 不可逆,则 \(\bm A\bm B\) 不可逆。这是因为若 \(\bm B\) 可逆,\(\bm A\bm B\sim\bm A\);若 \(\bm B\) 不可逆,\(\bm A\bm B\bm x=\bm0\) 有非平凡解。此时 \(\det\bm A=\det\bm A\cdot \det\bm B\) 均为零,是成立的。
若 \(\bm A\) 可逆,存在初等矩阵 \(\bm E_1,\bm E_2,\cdots,\bm E_p\) 使得 \(\bm A=\bm E_p\bm E_{p-1}\cdots\bm E_1\),使用定理 3 可得
\[\begin{aligned}|\bm A\bm B|&=|\bm E_P\bm E_{p-1}\cdots\bm E_1\bm B|=|\bm E_p|\cdot|\bm E_{p-1}\cdots\bm E_1\bm B|\\&=|\bm E_p||\bm E_{p-1}|\cdots|\bm E_1||\bm B|=\cdots=|\bm E_p\bm E_{p-1}\cdots\bm E_1||B|\\&=|\bm A||\bm B|\end{aligned} \]得证。
行列式函数的一个线性性质
对于 \(n\times n\) 矩阵 \(\bm A\),可将 \(\det\bm A\) 视为 \(\bm A\) 中 \(n\) 个列向量的函数。若只改变某一列的向量,则 \(\det\bm A\) 是该可变列向量的线性函数。
假设 \(\bm A\) 的第 \(j\) 列有变化,使得
定义由 \(\mathbb{R}^n\) 到 \(\mathbb{R}\) 的变换 \(T\) 为
则对于任意常数 \(c\) 和 \(\mathbb{R}^n\) 中任意 \(\bm x,\bm u,\bm v\),有
第一个使用定理 3c 即可。第二个可由按第 \(j\) 列的代数余子式展开式得到。
3.3 克拉默法则、体积和线性变换
克拉默法则
对任意 \(n\times n\) 矩阵 \(\bm A\) 和任意的 \(\mathbb{R}^n\) 中向量 \(\bm b\),令 \(\bm A_i(\bm b)\) 表示 \(\bm A\) 中第 \(i\) 列由向量 \(\bm b\) 替换得到的矩阵。
定理 7(克拉默法则)
设 \(\bm A\) 是一个可逆的 \(n\times n\) 矩阵,对 \(\mathbb{R}^n\) 中任意向量 \(\bm b\),方程 \(\bm A\bm x=\bm b\) 的唯一解可由下式给出:
\[x_i=\frac{\det\bm A_i(\bm b)}{\det\bm A},i=1,2,\cdots,n \]
用 \(\bm e_1,\bm e_2,\cdots,\bm e_n\) 表示 \(\bm I\) 的列。若 \(\bm A\bm x=\bm b\),有
\[\begin{aligned}\bm A\cdot\bm I_i(\bm x)&=\bm A\begin{bmatrix}\bm e_1&\bm e_2&\cdots&\bm x&\cdots&\bm e_n\end{bmatrix}=\begin{bmatrix}\bm A\bm e_1&\bm A\bm e_2&\cdots&\bm A\bm x&\cdots&\bm A\bm e_n\end{bmatrix}\\&=\begin{bmatrix}\bm a_1&\bm a_2&\cdots&\bm b&\cdots&\bm a_n\end{bmatrix}=\bm A_i(\bm b)\end{aligned} \]由行列式的乘法性质,
\[(\det\bm A)(\det\bm I_i(\bm x))=\det\bm A_i(\bm b) \]左式的右半部分为 \(x_i\),于是 \((\det\bm A)x_i=\det\bm A_i(\bm b)\)。又 \(\bm A\) 可逆,\(\det\bm A\ne0\),得证。
在工程上的应用
许多工程上的问题(特别是电子工程和控制论)能用拉普拉斯变换进行分析。其将一个适当的线性微分方程组转变为一个线性代数方程组,它的系数含有一个参数。
考虑下列方程组,\(s\) 为未定参数。确定 \(s\) 使得方程组有唯一解并用克拉默法则求出它。
\[\begin{cases}3sx_1&-2x_2&=4\\-6x_1&+sx_2&=1\end{cases} \]
将方程组视为 \(\bm A\bm x=\bm b\) 型,则
\[\bm A=\begin{bmatrix}3s&-2\\-6&s\end{bmatrix}\quad\bm A_i(\bm b)=\begin{bmatrix}4&-2\\1&s\end{bmatrix}\quad\bm A_2(\bm b)=\begin{bmatrix}3s&4\\-6&1\end{bmatrix} \]\(\det\bm A=3s^2-12=3(s+2)(s-2)\),于是 \(s\ne\pm2\) 时方程组有唯一解,方程组的的解 \((x_1,x_2)\) 满足
\[\begin{cases}\displaystyle x_1=\frac{\det\bm A_1(b)}{\det\bm A}=\frac{4s+2}{3(s+2)(s-2)}\\\displaystyle x_2=\frac{\det\bm A_2(\bm b)}{\det\bm A}=\frac{3s+24}{3(s+2)(s-2)}=\frac{s+8}{(s+2)(s-2)}\end{cases} \]
一个求 \(\bm A^{-1}\) 的公式
\(\bm A^{-1}\) 的第 \(j\) 列是一个向量 \(\bm x\),其满足 \(\bm A\bm x=\bm e_j\)。\(\bm x\) 的第 \(i\) 个元素是 \(\bm A^{-1}\) 中的 \((i,j)\) 元素,由克拉默法则,
\(\bm A_i(\bm e_j)\) 按第 \(i\) 列的代数余子式展开式为
于是 \(\bm A^{-1}\) 的 \((i,j)\) 元素等于代数余子式 \(C_{ji}\) 除以 \(\det\bm A\)。那么
右边的代数余子式的矩阵称为 \(\bm A\) 的伴随矩阵,称为 \(\mathrm{adj}\bm A\)(伴随矩阵是代数余子式的矩阵的转置)。下列定理复述该式。
定理 8(逆矩阵公式)
设 \(\bm A\) 是一个可逆的 \(n\times n\) 矩阵,则 \(\bm A^{-1}=\dfrac{1}{\det\bm A}\mathrm{adj}\bm A\)。
数值计算
定理 8 主要用于理论计算,使得不必计算 \(\bm A^{-1}\) 就能推导其性质。
克拉默法则也是一个理论工具,可以用来研究 \(\bm A\bm x=\bm b\) 的解如何随 \(\bm A\) 和 \(\bm b\) 中元素的变化而变化。对于较小的复数矩阵,行化简 \(\begin{bmatrix}\bm A&\bm b\end{bmatrix}\) 较麻烦,而行列式计算相对简单,故其有时在手算时被选用。然而当 \(n\) 很大时就没有什么作用了。
用行列式表示面积或体积
定理 9
若 \(\bm A\) 是一个 \(2\times 2\) 矩阵,则由 \(\bm A\) 的列确定的平行四边形的面积为 \(|\det\bm A|\)。若 \(\bm A\) 是一个 \(3\times 3\) 矩阵,则由 \(\bm A\) 的列确定的平行六面体的体积为 \(|\det\bm A|\)。
\(2\times 2\) 的是两个向量围成的;\(3\times 3\) 的差不多,长这个样(方便理解):
若 \(\bm A\) 为 \(2\) 阶对角矩阵,定理显然成立:
\[\Bigg|\det\begin{bmatrix}a&0\\0&d\end{bmatrix}\Bigg|=|ad|=\{矩阵的面积\} \]若 \(\bm A\) 不为对角情形,只需证 \(\bm A=\begin{bmatrix}\bm a_1&\bm a_2\end{bmatrix}\) 能变换成一个对角矩阵,变换时不改变相应平行四边形面积和 \(|\det\bm A|\)。\(\bm A\) 进行列交换和列倍加操作不改变 \(|\det\bm A|\),而这些运算足以将 \(\bm A\) 变换为对角矩阵。列交换不改变对应平行四边形,我们只需证明以下 \(\mathbb{R}^2\) 和 \(\mathbb{R}^3\) 中的向量的简单几何现象:
- 设 \(\bm a_1\) 和 \(\bm a_2\) 为非零向量,则对任意数 \(c\),由 \(\bm a_1\) 和 \(\bm a_2\) 确定的平行四边形的面积等于由 \(\bm a_1\) 和 \(\bm a_2+c\bm a_1\) 确定的平行四边形的面积。
这个是比较浅显的:考虑 \(\bm a_2+c\bm a_1\) 对应的点到直线 \(\bm a_1\) 的距离不变即可。对于 \(\mathbb{R^3}\) 的话就是面。
于是 \(2\times 2\) 的情况得证。
定理对 \(3\times 3\) 对角阵 \(\begin{bmatrix}a&0&0\\0&b&0\\0&0&c\end{bmatrix}\) 显然成立。任意一个 \(3\times 3\) 矩阵均可用不改变 \(|\det\bm A|\) 的列变换变换为对角矩阵,而如前面所述,向量 \(\bm a_2+c\bm a_1\) 到 \(\mathrm{Span}\{\bm a_1,\bm a_3\}\) 的距离不变,平行六面体的体积不变。得证。
线性变换
设集合 \(S\) 在线性变换 \(T\) 的定义域内,用 \(T(S)\) 表示 \(S\) 中点的像集。我们研究 \(T(S)\) 的面积(体积)与原来集合 \(S\) 的面积(体积)的变化。为方便,若 \(S\) 是一个边界为平行四边形的区域,用 \(S\) 表示一个平行四边形。
定理 10
设 \(T:\mathbb{R}^2\rightarrow\mathbb{R}^2\) 是由一个 \(2\times 2\) 矩阵 \(\bm A\) 确定的线性变换,若 \(S\) 是 \(\mathbb{R}^2\) 中一个平行四边形,则
\[\{T(S)的面积\}=|\det\bm A|\cdot\{S的面积\} \]若 \(T\) 是一个由 \(3\times 3\) 矩阵 \(\bm A\) 确定的线性变换,而 \(S\) 是 \(\mathbb{R}^3\) 中的一个平行六面体,则
\[\{T(S)的体积\}=|\det\bm A|\cdot\{S的体积\} \]
考虑 \(2\times 2\) 的情形。一个顶点为 \(\mathbb{R}^2\) 中原点的平行四边形由向量 \(\bm b_1\) 和 \(\bm b_2\) 确定,有如下形式:
\[S=\{s_1\bm b_1+s_2\bm b_2:0\le s_1\le 1,0\le s_2\le 1\} \]\(S\) 在 \(T\) 下的像由以下形式的点组成:
\[T(s_1\bm b_1+s_2\bm b_2)=s_1\bm A\bm b_1+s_2\bm A\bm b_2 \]所以 \(T(S)\) 是一个由矩阵 \(\begin{bmatrix}\bm A\bm b_1&\bm A\bm b_2\end{bmatrix}\) 的列确定的平行四边形,可以将该矩阵写为 \(\bm A\bm B\),\(\bm B=\begin{bmatrix}\bm b_1&\bm b_2\end{bmatrix}\)。由定理 9 和行列式的乘积定理,
\[\begin{aligned}\{T(S)的面积\}&=|\det\bm A\bm B|=|\det\bm A||\det\bm B| \\ &=|\det\bm A|\cdot\{S的面积\}\end{aligned} \]任意平行四边形具有形式 \(\bm p+S\),\(\bm p\) 为一向量,\(S\) 同上。由于平移不改变集合面积,有
\[\begin{aligned}\{T(\bm p+S)的面积\} &= \{T(\bm p)+T(S)的面积\} \\ &= \{T(S)的面积\} \\ &= |\det\bm A|\cdot\{S的面积\} \\ &=|\det\bm A|\cdot\{(\bm p+S)的面积\}\end{aligned} \]\(3\times 3\) 的情形类似。得证。
若尝试把定理 10 推广至 \(\mathbb{R}^2\) 和 \(\mathbb{R}^3\) 中不是由直线或平面所围的区域时,可以用微分思想将其划分为若干平行四边形或平行六面体,于是有如下结论。
定理 10 的结论对 \(\mathbb{R}^2\) 这种任意具有有限面积的区域或 \(\mathbb{R}^3\) 中具有有限体积的区域均成立。
对正数 \(a,b\),求以方程为 \(\dfrac{x_1^2}{a^2}+\dfrac{x_2^2}{b^2}=1\) 的椭圆为边界的区域 \(E\) 的面积。
可以得到 \(E\) 是单位圆盘 \(D\) 在线性变换 \(T\) 下的像,\(T\) 由矩阵 \(\bm A=\begin{bmatrix}a&0\\0&b\end{bmatrix}\),因为若 \(\bm u,\bm x\in\mathbb{R}^2\),且 \(\bm x=\bm A\bm u\),则
\[u_1=\frac{x_1}{a},u_2=\frac{x_2}{b} \]那么如果 \(\bm u\) 在单位圆盘内,即 \(u_1^2+u_2^2\le 1\),当且仅当 \(\bm x\) 在 \(E\) 内,即 \((\dfrac{x_1}{a})^2+(\dfrac{x_2}{b})^2\le 1\),由定理 10 的推广,
\[\begin{aligned} \{椭圆的面积\} &=\{T(D)的面积\} \\ &=|\det\bm A|\cdot\{D的面积\} \\ &=\pi ab \end{aligned} \]