5.【线性代数】 05 - 线性变换2015-11-17

6.【线性代数】 06 - Jordan标准型2015-11-18 7.【线性代数】 07 - 线性函数2016-01-02 8.【线性代数】 08 - 线性空间的度量2016-01-03 9.【线性代数】 09 - 正规变换和二次型2016-01-05 10.【高等代数】01 - 行列式和矩阵的秩2020-05-07 11.【高等代数】02 - 矩阵的逆和相似矩阵2020-05-07 12.【高等代数】03 - 二次型和矩阵的分解2020-05-07 13.【高等代数】04 - 多项式环2020-05-07 14.【高等代数】05 - 线性变换2021-02-22 15.【高等代数】06 - 线性函数2021-05-22

　　之前的概念只是线性代数中最基本的工具，而线性代数最核心的内容在这里才刚刚开始。我们知道，代数的对象是结构，而代数的核心则是变换。结构间的变换不光揭露了它们之间的本质关系，它还是了解结构本身深层属性的有力工具。变换本身没有什么，我们更关注的其实是变中的不变，不变量则又是变换的核心。

1. 线性映射

1.1 定义和基本性质

　　在抽象代数中，同态映射是深入理解代数结构的重要方法，它可以对其进行纵向分解，从更宏观的角度解析代数结构。之前我们把矩阵定义成一种映射，可见想要深入了解矩阵，就必须回到它的根源上去。线性空间首先是一个交换群，同态映射的定义可以照搬过来。另一方面，线性空间还有数乘运算，而且这才是它的核心所在，故同态映射还需保持数乘的形式不变。为此定义线性空间 $V, V^{'}$ 之间的映射如下，并称 $A$ 为从 $V$ 到 $V^{'}$ 的线性映射。

$\begin{matrix} (1) & A (α + β) = A (α) + A (β), A (k α) = k A (α) \end{matrix}$

　　当映射为双射的时候，它显然是个同构映射，也就是个可逆运算。而一般的线性映射，每个像的原像可能不止一个，顺着这个关系，我们依次要讨论的是：像的结构是怎样的？每个像的原像是什么？像和原像有什么关系？使用定义比较容易验证，线性映射的像 $A (V)$ 是一个线性空间，且有公式（2）成立。

$\begin{matrix} (2) & A (0) = 0, A (- α) = - A (α), A (k_{1} α_{1} + \dots + k_{n} α_{n}) = k_{1} A (α_{1}) + \dots + k_{n} A (α_{n}) \end{matrix}$

　　设所有从 $V$ 到 $V^{'}$ 的线性映射组成集合 $Hom (V, V^{'})$ ，容易验证它在式（3）的运算下是一个线性空间。另外显然，复合线性映射 $V \overset{B}{\mapsto} V^{'} \overset{A}{\mapsto} V^{″}$ 也是线性映射，且满足公式（4）。还可以证明，复合运算和加法运算满足分配率（5），但由于乘法不封闭，故不一定是环。

$\begin{matrix} (3) & (A + B) (α) = A (α) + B (α), (k A) (α) = k (A (α)) \end{matrix}$

$\begin{matrix} (4) & k (AB) = (k A) B = A (k B) \end{matrix}$

$\begin{matrix} (5) & (A + B) C = AC + BC, C (A + B) = CA + CB \end{matrix}$

1.2 核和商空间

　　仿照抽象代数，定义 $0$ 的原像集合 $W$ 为 $A$ 的核，记作 $Ker A$ ，容易验证它是 $V$ 的子空间。继续考察任意像 $α^{'}$ 的原像，设 $A (α) = α^{'}$ ，易知 $A (α_{0}) = α^{'}$ 的充要条件是 $α - α_{0} \in W$ ，即 $α_{0}$ 在陪集 $α + W$ 中。这就在像和陪集之间建立了一一对应的关系，它可用如下映射表示。

$\begin{matrix} (6) & σ : α + W \mapsto α^{'}, A (α) = α^{'} \end{matrix}$

　　如果在陪集上定义如下运算（式（7）），可以证明该运算是良性的，且陪集集合形成一个线性空间，它叫商空间，记作 $V / W$ 。容易验证 $σ$ 是一个线性变换，故商空间和像同构（公式（8）），这样我们就彻底弄清了像与原像的关系。其实对任意一个子群 $W$ ，都可以定义映射 $α \mapsto (α + W)$ ，容易证明它就是以 $W$ 为核的线性映射，这个映射也叫自然映射。以上正反的推导说明，线性空间 $V$ 上的线性映射和它的子空间是等价的。

$\begin{matrix} (7) & (α + W) + (β + W) = (α + β) + W, k (α + W) = k α + W \end{matrix}$

$\begin{matrix} (8) & V / W ≅ A (V), W = Ker A \end{matrix}$

　　下面继续讨论有限维空间中，核空间和商空间的关系。首先根据抽象代数的结论，空间元素的个数满足 $| V | = | W | \cdot | V / W |$ ，从而它们的维度满足公式（9）。设空间 $V$ 的维度是 $n$ ，核 $W$ 的维度是 $r$ ，且 $α_{1}, \dots, α_{r}$ 是它的一组基。现在来寻找 $V / W$ 的一组基 $β_{1} + W, \dots, β_{n - r} + W$ ，首先 $β_{1}, \dots, β_{n - r}$ 当然是线性无关的，又由于它们都不在 $W$ 中，故 $α_{1}, \dots, α_{r}, β_{1}, \dots, β_{n - r}$ 正好组成 $V$ 的一组基。

$\begin{matrix} (9) & \dim V = \dim W + \dim (V / W) \end{matrix}$

　　商空间在三维空间中有较直观的形象，比如空间中的一维子空间就是任意过原点的直线 $l$ ，它的陪集就是所有与 $l$ 平行的直线，商空间自然就是这些平行线组成的线性空间。为了更直观地理解这个商空间，观察任意一个过原点且不与 $l$ 平行的平面 $π$ ，所有的平行线与 $π$ 的唯一交点正好组成 $π$ ，故二维空间 $π$ 可以看做这个商空间的同构空间。再比如，当我们取某个过零点平面 $π$ 作为子空间时，商空间就是所有与之平行的平面，与这个商空间同构的一维空间是任意一条过零点且不与 $π$ 平行的直线 $l$ 。

1.3 映射的矩阵

　　根据公式（2）的第3式可知，有限维线性空间的线性映射可以由 $V$ 的一组基完全确定。具体来讲，选择 $V$ 的一组基 $α_{1}, \dots, α_{n}$ ，再选择 $V^{'}$ 的一组基 $β_{1}, \dots, β_{m}$ ，线性映射可以表示成如下表达式。故每个线性映射在选定的基下都确定一个矩阵 $A$ ，且反之对任意 $n \times m$ 阶矩阵，式子（10）也定义了一个线性变换。所以在有限维空间中，可以把线性映射和矩阵等价看待。这与我们在矩阵乘法中的视角相一致，但要注意 $AB$ 的矩阵是 $B A$ （自行验证）。

$\begin{matrix} (10) & A (α_{1}, \dots, α_{n}) = A_{n \times m} (β_{1}, \dots, β_{m}) \end{matrix}$

　　对于同一个线性映射，选择 $V, V^{'}$ 的不同基，得到的矩阵也是不同的。设 $(α_{1}^{'}, \dots, α_{n}^{'}) = P (α_{1}, \dots, α_{n})$ 和 $(β_{1}^{'}, \dots, β_{m}^{'}) = Q (β_{1}, \dots, β_{m})$ 是另一组基，则有式（11）成立，即线性映射的矩阵变为 $P A Q^{- 1}$ 。反之对任意 $n, m$ 阶的可逆方阵 $P, Q$ ， $B = P A Q^{- 1}$ 都是同一个线性映射在某组基下的矩阵。满足以上条件的 $A, B$ 称为是相抵矩阵，显然相抵矩阵是一个等价类，每一个类对应 $Hom (V, V^{'})$ 中的一个元素。

$\begin{matrix} (11) & A (α_{1}^{'}, \dots, α_{n}^{'}) = P A (α_{1}, \dots, α_{n}) = P A (β_{1}, \dots, β_{m}) = P A Q^{- 1} (β_{1}^{'}, \dots, β_{m}^{'}) \end{matrix}$

　　由上一篇的结论知，总存在可逆方阵 $P, Q$ ，使得 $P A Q^{- 1} = [\begin{matrix} I_{r} & 0 \\ 0 & 0 \end{matrix}]$ 。在对应基下，线性映射有了最简单的形式，它也是最本质的形式，同构意义下 $n$ 维到 $m$ 维空间的线性映射仅有 $min (n, m)$ 个。另外，显然 $A$ 的秩 $r$ 正是 $A (V)$ 的维度，故 $r$ 也称为 $A$ 的秩，同样记作 $rank A$ 。

　　如果把相抵看成是一种变换，我们更关注其中不变的量，比如矩阵的秩，并称之为变换的不变量。不变量是变换或等价类的重要属性，它也是考察变换的主要工具。反之，一旦矩阵的阶和秩确定，它们所属的相抵等价类也就确定了，这样的量可以唯一刻画变换，它被称为变换的全系不变量。关于不变量的讨论将贯穿今后的内容，因为这才是线性代数最精华的部分，全系不变量不仅可以给出变换的简单标准式，还可以对变换进行彻底地分类。

2. 线性变换

2.1 线性变换和相似矩阵

　　线性空间 $V$ 到自身的线性映射也叫线性变换，它们组成的集合简记为 $Hom (V)$ ，由于乘法在其中是封闭的，故它是一个环。恒等变换 $I$ 将每个元素变换到自身，显然它是环的单位元，故 $Hom (V)$ 还是含幺环。像这种定义了乘法的线性空间，且乘法满足公式（4）（5）和存在单位元，我们一般称之为域 $K$ 上的代数。代数是很常见的结构，比如一般的数域、 $n$ 维方阵、一元多项式等等。

　　一一映射的线性变换是可逆映射，它的逆一般也记作 $A^{- 1}$ 。又由于线性变换在乘法上的封闭性，可以很自然地定义它的幂运算（12），且它符合一般幂运算的性质，不再赘述。

$\begin{matrix} (12) & A^{0} = I, A^{m} = A A^{m - 1}, A^{- m} = (A^{- 1})^{m} \end{matrix}$

　　对 $n$ 维空间 $V$ ，线性变换 $A$ 同样可以对应到 $n$ 阶方阵 $A$ ，且变换可逆与矩阵可逆等价。前面已经看到，线性映射是矩阵的直观表示，我们同样可以用线性变换来研究方阵的性质。比如考察序列 $A, A^{2}, A^{3}, \dots$ ，显然有 $A (V) \supseteq A^{2} (V) \supseteq \dots$ ，由于秩不可能无限递减，故存在 $A^{k} (V) = A^{k + 1} (V)$ 。一旦出现这种情况，等式会一直成立下去，从而必定有式（13）成立。

$\begin{matrix} (13) & A^{n} (V) = A^{n + 1} (V) = \dots, rank A^{n} = rank A^{n + 1} = \dots \end{matrix}$

　　既然像和原像在同一空间，对它们选择相同一组基 $α_{1}, \dots, α_{n}$ 会比较方便，这也是线性变换不同于一般线性映射的根本原因。当取另一组基 $(α_{1}^{'}, \dots, α_{n}^{'}) = P (α_{1}, \dots, α_{n})$ 时，易知线性变换的矩阵变为 $P A P^{- 1}$ 。更一般地，如果矩阵 $A, B$ 满足式（14），则称 $A, B$ 是相似矩阵，记作 $A \sim B$ 。同样地，相似矩阵的等价类与 $Hom (V)$ 的元素一一对应。

$\begin{matrix} (14) & B = P A P^{- 1}, | P | \neq 0 \end{matrix}$

　　下一篇的主要任务将是研究相似矩阵的不变量和全系不变量，以得到相似标准型及相似矩阵的完全分类，这里先做一些准备工作。

2.2 不变子空间

　　由于线性变换的像和原像在同一空间，它们总是纠缠在一起，不能像线性映射那样变得简单。但我们还是希望将变换尽量分割开来，具体讲就是，将 $V$ 分解为尽量小的子空间 $V_{1} \oplus V_{2} \oplus \dots \oplus V_{s}$ ，且线性变换的像 $A (V_{i})$ 还在 $V_{i}$ 中。这样在对应的基下，变换的矩阵是一个分块对角矩阵。进一步地，如果这样的分割唯一，我们还能对矩阵或变换进行分类。

　　为此我们先简单讨论一下这样的子空间 $W$ ，如果它满足 $A (W) \subseteq W$ ，则称之为 $A$ 的不变子空间。显然 $V$ 本身、变换的核 $Ker A$ 、变换的像 $A (V)$ 都是不变子空间。根据定义还可以证明，不变子空间的和、交都是不变子空间。另外，如果选取 $W$ 的一组基并将其扩展成 $V$ 的基，则显然变换的矩阵是如下分块下三角矩阵，其中 $r$ 是 $W$ 的维度。

$\begin{matrix} (15) & [\begin{matrix} X_{r \times r} & 0 \\ Z & Y_{(n - r) \times (n - r)} \end{matrix}] \end{matrix}$

　　如果在商空间 $V / W$ 中定义映射 $α + W \mapsto A α + W$ ，首先由于 $W$ 是不变子空间，易知这是一个良定义。再通过简单的验证可知这个映射是线性变换，它也被称为 $A$ 在 $V / W$ 上的诱导变换。设 $W$ 的基为 $α_{1}, \dots, α_{r}$ ，扩展为 $V$ 的基为 $α_{1}, \dots, α_{n}$ ，则可以证明，诱导变换在基 $α_{r + 1} + W, \dots, α_{n} + W$ 下的矩阵正好就是公式（15）中的 $Y$ 。

　　其实 $A (V), Ker A$ 为不变子空间这一结论是可以进行扩展的，这里介绍一个十分有用的结论。设线性变换 $B$ 满足 $AB = BA$ ， $V^{'}$ 是 $A$ 的不变子空间，容易验证 $B^{- 1} (V^{'})$ 和 $B (V^{'})$ 都是 $A$ 的不变子空间。特别地，如果取 $B$ 为多项式 $f (A)$ ，并分别取 $V^{'}$ 为 $V$ 和 $0$ ，则有 $f (A) (V)$ 和 $Ker f (A)$ 都是 $A$ 的不变子空间。

2.3 循环子空间

　　有一种不变子空间比较容易想到，那就是从某个向量 $α$ 开始“生成”的不变子空间。要使得它是不变子空间，则要求 $α, A (α), A^{2} (α), \dots$ 都属于这个空间。在有限空间中，这个序列迟早会变得线性相关，设在 $A^{m} (α)$ 处第一次出现线性相关，则它可以由 $α, \dots, A^{m - 1} (α)$ 线性表出（式（16）），而且显然后面所有的向量都可以由这前 $m$ 个向量线性表出。

$\begin{matrix} (16) & A^{m} (α) = a_{m - 1} A^{m - 1} (α) + \dots + a_{1} A (α) + a_{0} α \end{matrix}$

　　这 $m$ 个向量的生成子空间被称为由 $α$ 生成的循环子空间，记做 $C_{α}$ （公式（17））。显然 $C_{α}$ 的维数是 $m$ ，且容易证明，它是包含 $α$ 的最小不变子空间。取这 $m$ 个向量作为 $C_{α}$ 的基，容易验证 $A |_{C_{α}}$ 在这组基下的矩阵为式（18）。

$\begin{matrix} (17) & C_{α} = ⟨ α, A (α), \dots, A^{m - 1} (α) ⟩ \end{matrix}$

$\begin{matrix} (18) & [\begin{matrix} 0 & 1 \\ ⋱ & ⋱ \\ ⋱ & 1 \\ 0 \\ a_{0} & a_{1} & \dots & a_{m - 1} \end{matrix}] \end{matrix}$

2.4 特征值和特征向量

　　最简单的循环子空间当然就是 $α$ 的生成子空间 $⟨ α ⟩$ ，这时有公式（19）左边的关系。将满足条件的 $α$ 称为 $A$ 的特征向量，对应的 $λ$ 称为特征值。这个关系等价于（19）的右式，要使非零的 $α$ 存在，特征矩阵 $λ I - A$ 的行列式必须为 $0$ 。容易证明它的行列式有式（20）的格式，多项式 $φ (λ)$ 称为 $A$ 的特征多项式。

$\begin{matrix} (19) & A (α) = λ α \Leftrightarrow (λ I - A) α = 0 \end{matrix}$

$\begin{matrix} (20) & | λ I - A | = φ (λ) = λ^{n} - (a_{11} + \dots + a_{n n}) λ^{n - 1} + \dots + (- 1)^{n} | A | \end{matrix}$

　　• $A, B$ 为复方阵，求证 $A B, B A$ 的特征多项式相同。

　　显然 $A$ 的所有特征值就是 $φ (λ) = 0$ 的所有根，根 $λ_{i}$ 的重数称为特征值的代数重数。另外容易证明，任意特征值 $λ_{i}$ 的所有特征向量组成一个线性空间，称为特征子空间，记作 $V_{λ_{i}}$ ，这个线性空间的维数称为特征值的几何重数。当 $λ_{i} \neq λ_{j}$ 时，考虑 $0$ 在 $V_{λ_{i}} + V_{λ_{j}}$ 上的分解（式（21）左），设 $0 = α_{i} + α_{j}$ ，将 $A$ 作用于两边得式（21）右，联立两个等式知 $α_{i} = α_{j} = 0$ 。从而 $V_{λ_{i}} \cap V_{λ_{j}} = 0$ ，从而可知任意两个特征子空间都不相交。

$\begin{matrix} (21) & 0 = α_{i} + α_{j}; 0 = λ_{i} α_{i} + λ_{j} α_{j} \end{matrix}$

　　这样就可以选取各特征子空间的基并将其扩展为空间的集，线性变换在这组基下的矩阵具有以下形式，其中 $n_{1}, \dots, n_{s}$ 为特征值的几何重数。通过这个式子可以看到几何重数不大于代数重数，当所有几何重数等于代数重数时，矩阵就成为对角矩阵，这样的矩阵也称为可对角化的。反之也显然，可对角化矩阵的几何重数与代数重数都相等，它们是等价的。

$\begin{matrix} (22) & [\begin{matrix} λ_{1} I_{n_{1}} & \dots & 0 & 0 \\ 0 & ⋱ & 0 & 0 \\ 0 & \dots & λ_{s} I_{n_{s}} & 0 \\ B_{1} & \dots & B_{s - 1} & B_{s} \end{matrix}] \end{matrix}$

　　你可能注意到，特征值、特征向量、特征多项式在某个线性变换下都是确定的，故它们是矩阵相似变换下的不变量。但它们并不一定是全系不变量。因为即使有了特征值，矩阵（22）还是不确定的。当然矩阵可对角化时，特征值完全确定了矩阵，这时特征值就是矩阵在相似变换下的全系不变量。另外要注意，特征值的个数与域 $K$ 的选取有关，我们不妨先在代数闭域（对应数域中的复数域）中进行讨论，因为在代数闭域中所有多项式都能分解为一次多项式之积 $(λ - λ_{1}^{m_{1}}) \dots (λ - λ_{s}^{m_{s}})$ 。

　　在这种假设下，首先由公式（18）知道所有特征值（包括重根）的积为 $(- 1)^{n} | A |$ ，而它们的和则为 $a_{11} + \dots + a_{n n}$ ，由于特征值是不变量，所以对角线之和也是不变量。另外，任何矩阵都有特征值和特征向量，随便选取一对便得到相似矩阵 $[\begin{matrix} λ_{1} & 0 \\ C & B \end{matrix}]$ 。继续对 $B$ 进行类似的处理，就可以得到一个下三角相似矩阵，而对角线上正是所有特征值，且每个特征值的个数与其代数重数相同。

posted on 2015-11-17 23:18 卞爱华阅读(3273) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

万物皆数

【线性代数】 05 - 线性变换

1. 线性映射

1.1 定义和基本性质

1.2 核和商空间

1.3 映射的矩阵

2. 线性变换

2.1 线性变换和相似矩阵

2.2 不变子空间

2.3 循环子空间

2.4 特征值和特征向量

导航

搜索

合集

随笔分类

站点链接

阅读排行榜

最新评论