【高等代数】06 - 线性函数

合集 - 高等代数(15)

15.【高等代数】06 - 线性函数2021-05-22

　　在线性代数中，我们花了3篇讲解（双）线性函数的相关结论。这里我想把核心内容再阐述一遍，在忽略一些细节的同时，希望对整体结构有更深刻的理解。需要注意的是，这里双线性函数只是起点，后面的内积、酉变换、正规变换，都在不断地打破和拓展之前的概念，最终还是为了讨论特殊线性变换的标准型。

1. 双线性函数

1.1 双线性函数与正交

　　在有了双线性函数的定义后，可知在任意选定的一组基下，双行线函数 $f$ 可由其度量矩 $A$ 完全确定。站在矩阵的角度，相关概念也变得更加直观。比如固定左向量 $α$ 而得到的线性函数 $α_{L}$ ，可以对应到 $A$ 的行向量的线性组合（系数为 $α$ 坐标）。而全体 $α_{L}$ 组成的线性函数空间 $W_{L}$ ，则同构于 $A$ 的行向量生成的线性空间。那些使得 $α_{L} = 0$ 的全体 $α$ （双线性函数的左根 ${rad}_{L} f$ ），则同构于 $α A = 0$ 的解空间。对应右边的向量 $β$ ，也有定义 $W_{R}$ 和右根 ${rad}_{R} f$ 。当 $A$ 满秩时，左右根皆为空，这时称双线性函数是非退化的。

　　不同基下的度量矩阵 $A, B$ 也不相同，并且与两组基的变换矩阵 $P$ 有关系式 $B = P A P^{'}$ ，这样的矩阵 $A, B$ 称为合同矩阵。反之，同一组基下度量矩阵合同的变换，可以认为是同构的。为了讨论同构意义下双线性函数空间的结构，我们熟悉的方法是“不变”子空间的分割，为此还要规定式（1）左的正交性。可以证明，满足正交性的双线性函数必然是对称或反对称的，即 $A = A^{'}$ 或 $A = - A^{'}$ 。而双线性函数空间 $T_{2} (V)$ 是对称 $S_{2} (V)$ 和反对称 $A_{2} (V)$ 双线性函数空间的直和，故而有些讨论可以集中在后两个空间上。

$\begin{matrix} (1) & f (α, β) = 0 \Leftrightarrow f (β, α) = 0 \Leftrightarrow α ⊥ β \end{matrix}$

　　正交性自然地引出了向量或子空间正交补（子空间） $α^{⊥}, W^{⊥}$ 的概念。然后根据线性方程组的理论，容易推导 $W, W^{⊥}$ 维度之间的关系（行列向量维数与解空间的关系）。特别地有，双线性函数的左右根相同，可以记作 $V^{⊥} = rad f$ 。还有如果 $f$ 在子空间 $W$ 下非退化，易证 $W$ 和 $W^{⊥}$ 无交集、且维度之和是 $n$ ，从而它们是 $V$ 的正交分割（式（2））。

$\begin{matrix} (2) & rad f |_{W} = 0 \Rightarrow W \oplus W^{⊥} = V \end{matrix}$

　　式（2）可直接用于对称和反对称双线性函数（矩阵）的标准型讨论上。若是对称矩阵，先任选 $f (α, α) \neq 0$ ，根据式（2）先将 $V$ 分解成 $α \oplus α^{⊥}$ ，然后依此继续分解 $α^{⊥}$ ，直至剩下一个 $rad f$ 。在选定的基下（根空间任意选），函数的度量矩阵是一个对角矩阵（合同标准型）。再看反对称矩阵，先任选 $f (α, β) = 1$ ，根据式（2）从 $W = ⟨ α, β ⟩$ 开始正交分解，最终得到 $[\begin{matrix} 0 & 1 \\ - 1 & 0 \end{matrix}]$ 和 $0$ 组成的分块对角矩阵。

　　合同矩阵的秩是不变的，对称矩阵和反对称矩阵的秩在标准型上有明显的表现。反对称矩阵的秩一定是偶数，且标准型在任何域上的形式都是最简的。对称矩阵在不同域上还可以进一步讨论，以下先假定它的秩为 $r$ 。在复数域上，通过调整基的系数，可得到标准型 $diag {I_{r}, 0_{n - r}}$ 。在实数域上则可以得到标准型 $diag {I_{p}, - I_{q}, 0_{n - r}}$ ，其中 $p + q = r$ 。依次记三个子空间为 $V^{+}, V^{-}, V^{⊥}$ ，注意前两者并不唯一，而后者就是根空间。另外不难证明，任何“正”子空间都与 $V^{-} \oplus V^{⊥}$ 无交集，这就可以证得： $p, q$ 在任何标准型中都是一样的（惯性定律），它们被称为正（负）惯性指数。

1.2 内积与酉空间

　　实数域（或其子域）有更多实际的场景，把函数限定在实数域上还可以度量线性空间。为了引出长度的概念，还要对函数增加一个限定，即有 $f (α, α) > 0$ 恒成立。这时 $f$ 只能选择对称函数，且正惯性指数就是 $n$ （称为正定的），这样的函数也叫内积，记作 $α \cdot β$ 。引入内积后的实线性空间也叫欧几里得空间。接下来自然就是定义向量的长度 $‖ α ‖$ 、距离 $d (α, β)$ 、角度（式（3）），以及得到三角不等式和勾股定理（式（4,5），这里不再重复讲述。

$\begin{matrix} (3) & θ = \arccos \frac{α \cdot β}{‖ α ‖ \cdot ‖ β ‖} \end{matrix}$

$\begin{matrix} (4) & | ‖ α ‖ - ‖ β ‖ | ⩽ ‖ α + β ‖ ⩽ ‖ α ‖ + ‖ β ‖ \end{matrix}$

$\begin{matrix} (5) & {‖ α ‖}^{2} + {‖ β ‖}^{2} = {‖ α + β ‖}^{2} \end{matrix}$

　　有时候也需要在复数域空间上定义度量的概念，但双线性函数显然不能满足要求，这时要将实内积的定义进行扩展。首先第一元仍然是线性的，然后交换变量满足式（6）左的Hermite性（可推导出第二元的半线性）。这样的二元函数在选定的基下也有式（6）右的合同矩阵（共轭对称矩阵），同样也能定义正交性以及解析其标准合同矩阵。最后如果加上正定性的要求，这样的二元函数就是复内积，或简称内积。引入内积后的复线性空间也叫酉空间，其上也可以定义长度（模）、距离、角度，以及有三角不等式和勾股定理。

$\begin{matrix} (6) & f (β, α) = \overset{―}{f (α, β)} \Rightarrow A^{'} = \overset{―}{A} \end{matrix}$

　　Hermite性可以兼容实空间的线性，且复内积也是兼容实空间的实内积的，进而酉空间其实是阿基米德空间的母空间。所以如果不特别强调，以下我们都在复数域上讨论。另外，在定义了正交的空间中（不限定为内积），如果二元函数是非退化的，则使用Schmidt正交化总可以找到一组正交基。在内积空间中，还可以找到单位向量组成的标准正交基，这时内积空间同构于向量对于基的系数组成的坐标空间，而内积就等于坐标向量的内积（式（7））。

$\begin{matrix} (7) & α \cdot β = x_{1} \overset{―}{y_{1}} + x_{2} \overset{―}{y_{2}} + \dots + x_{n} \overset{―}{y_{n}} \end{matrix}$

1.3 正规变换与对角化

　　在内积限制下的线性变换（映射）比较常见，这里有必要讨论一下它的标准型。首先限定变换下向量间的距离是不变的（保距变换），不难证明它是一个双射的线性变换，而且等价于：将一组标准正交基变换为另一组标准正交基。也就是说变换矩阵满足 $P \overset{―}{P^{'}} = I$ ，这样的矩阵叫酉矩阵（实数域下叫正交矩阵），这样的变换则叫酉变换（实数域叫正交变换）。酉矩阵是名副其实的“单位矩阵”，它的行列式的模为1（利用特征式），所有特征值的模也为1（利用单位向量的变换），所有行（列）向量是正交的单位向量。

　　当我们讨论酉变换 $A$ （酉矩阵）的标准型时，其实并不一定有内积空间的定义，但如果补齐这部分定义，就能利用其独有的结构特点。正交性可以使空间分割变得非常方便，结合线性变换需要的 $A$ -子空间，容易想到去寻找一组正交的特征向量。先随意找到一个特征向量 $η$ ，并生成 $A$ -子空间 $W$ ，容易证得 $V = W \oplus W^{⊥}$ 。接下来利用双射性可知 $W^{⊥}$ 也是 $A$ -子空间（式（8），这一步不可缺少），从而可以在 $W^{⊥}$ 中继续寻找特征向量，最终得到式（9）的标准型。由于寻找的特征向量是正交的， $P \overset{―}{P^{'}}$ 一定是一个对角矩阵，如果把特征向量单位化， $P$ 也可以是酉矩阵。

$\begin{matrix} (8) & α \cdot A β = A α^{'} \cdot A β = α^{'} \cdot β = 0 \end{matrix}$

$\begin{matrix} (9) & P A P^{- 1} = diag {λ_{1}, λ_{2}, \dots, λ_{n}} \end{matrix}$

　　任意变换矩阵 $A$ 都定义在某组基下，如果将这组基定义为标准正交基，该定义便可扩展成整个域上的内积空间。刚才我们看到了正交在对角化中的作用，现在来继续榨取这个工具的威力，把对角化的范围尽量扩大。值得提醒的是，这里的讨论需借助内积的概念，因此线性空间被限定在数域上，对角化也只讨论正交对角化。现在回顾上面的讨论，最关键的一个条件是：如果 $W$ 是 $A$ -子空间，则 $W^{⊥}$ 也是 $A$ -子空间。为此就要有 $α \cdot A β = α^{'} \cdot β$ ，其中 $α, α^{'} \in W; β \in W^{⊥}$ 。如果不限定向量的范围，等式中的 $α^{'}$ 总是有解的，记 $A^{*} : α \to α^{'}$ ，不难证明它是线性变换，且满足 $A^{*} = \overset{―}{A^{'}}$ ，它也称为 $A$ 的伴随变换。

　　伴随变换的矩阵关系 $A^{*} = \overset{―}{A^{'}}$ ，使得它的定义可以更加自由灵活，比如教材上一般定义为 $A α \cdot β = α \cdot A^{*} β$ 。这里还会发现一个简单事实，如果 $W$ 是 $A$ -子空间，那么 $W^{⊥}$ 就是 $A^{*}$ -子空间。想要从特征空间 $W = ⟨ η ⟩$ 开始构造对角化，就要证明 $W^{⊥}$ 是 $A$ -子空间，这也等价于 $W$ 是 $A^{*}$ -子空间。不过在此之前，我们先从 $A$ 可正交对角化出发，看看变换还有什么必要条件。记正交对角化 $A = P D P^{- 1}$ ，则有 $A^{*} = P \bar{D} P^{- 1}$ ，这时 $A A^{*} = A^{*} A$ 。反之，可交换性使得 $A, A^{*}$ 能像标量一样在表达式里“自由穿梭”，比如容易有 $‖ A α ‖ = ‖ A^{*} α ‖$ ，更一般的还有 $‖ f (A) α ‖ = ‖ f (A^{*}) α ‖$ 。

　　特别地，则有我们需要的 $‖ (A - λ I) α ‖ = ‖ (A^{*} - \overset{―}{λ} I) α ‖ = 0$ ，即 $W$ 是 $A^{*}$ -子空间。综合这两段的讨论便有，数域上的线性变换 $A$ 可正交对角化的充要条件是： $A$ 有 $n$ 个特征值且 $A A^{*} = A^{*} A$ （或式（10）的等价条件），满足式（10）的变换也称为正规变换。然后就可以构造一些常见的正规变换，比如上面讨论的酉变换，再比如复数域上的共轭对称变换 $A = \overset{―}{A^{'}}$ ，也被称为Hermite变换，实数域上就是熟知的对称变换。酉变换和Hermite变换天然有 $n$ 个特征值，而注意到Hermite变换的特征值都是实数，所以对称变换也有 $n$ 个特征值（放到复数域看），它们都可以正交对角化。