【线性代数】 05 - 线性变换

  之前的概念只是线性代数中最基本的工具,而线性代数最核心的内容在这里才刚刚开始。我们知道,代数的对象是结构,而代数的核心则是变换。结构间的变换不光揭露了它们之间的本质关系,它还是了解结构本身深层属性的有力工具。变换本身没有什么,我们更关注的其实是变中的不变,不变量则又是变换的核心。

1. 线性映射

1.1 定义和基本性质

  在抽象代数中,同态映射是深入理解代数结构的重要方法,它可以对其进行纵向分解,从更宏观的角度解析代数结构。之前我们把矩阵定义成一种映射,可见想要深入了解矩阵,就必须回到它的根源上去。线性空间首先是一个交换群,同态映射的定义可以照搬过来。另一方面,线性空间还有数乘运算,而且这才是它的核心所在,故同态映射还需保持数乘的形式不变。为此定义线性空间V,V之间的映射如下,并称A为从VV线性映射

(1)A(α+β)=A(α)+A(β),A(kα)=kA(α)

  当映射为双射的时候,它显然是个同构映射,也就是个可逆运算。而一般的线性映射,每个像的原像可能不止一个,顺着这个关系,我们依次要讨论的是:像的结构是怎样的?每个像的原像是什么?像和原像有什么关系?使用定义比较容易验证,线性映射的像A(V)是一个线性空间,且有公式(2)成立。

(2)A(0)=0,A(α)=A(α),A(k1α1++knαn)=k1A(α1)++knA(αn)

  设所有从VV的线性映射组成集合Hom(V,V),容易验证它在式(3)的运算下是一个线性空间。另外显然,复合线性映射VBVAV也是线性映射,且满足公式(4)。还可以证明,复合运算和加法运算满足分配率(5),但由于乘法不封闭,故不一定是环。

(3)(A+B)(α)=A(α)+B(α),(kA)(α)=k(A(α))

(4)k(AB)=(kA)B=A(kB)

(5)(A+B)C=AC+BC,C(A+B)=CA+CB

1.2 核和商空间

  仿照抽象代数,定义0的原像集合WA,记作KerA,容易验证它是V的子空间。继续考察任意像α的原像,设A(α)=α,易知A(α0)=α的充要条件是αα0W,即α0在陪集α+W中。这就在像和陪集之间建立了一一对应的关系,它可用如下映射表示。

(6)σ:α+Wα,A(α)=α

  如果在陪集上定义如下运算(式(7)),可以证明该运算是良性的,且陪集集合形成一个线性空间,它叫商空间,记作V/W。容易验证σ是一个线性变换,故商空间和像同构(公式(8)),这样我们就彻底弄清了像与原像的关系。其实对任意一个子群W,都可以定义映射α(α+W),容易证明它就是以W为核的线性映射,这个映射也叫自然映射。以上正反的推导说明,线性空间V上的线性映射和它的子空间是等价的。

(7)(α+W)+(β+W)=(α+β)+W,k(α+W)=kα+W

(8)V/WA(V),W=KerA

  下面继续讨论有限维空间中,核空间和商空间的关系。首先根据抽象代数的结论,空间元素的个数满足|V|=|W|·|V/W|,从而它们的维度满足公式(9)。设空间V的维度是n,核W的维度是r,且α1,,αr是它的一组基。现在来寻找V/W的一组基β1+W,,βnr+W,首先β1,,βnr当然是线性无关的,又由于它们都不在W中,故α1,,αr,β1,,βnr正好组成V的一组基。

(9)dimV=dimW+dim(V/W)

  商空间在三维空间中有较直观的形象,比如空间中的一维子空间就是任意过原点的直线l,它的陪集就是所有与l平行的直线,商空间自然就是这些平行线组成的线性空间。为了更直观地理解这个商空间,观察任意一个过原点且不与l平行的平面π,所有的平行线与π的唯一交点正好组成π,故二维空间π可以看做这个商空间的同构空间。再比如,当我们取某个过零点平面π作为子空间时,商空间就是所有与之平行的平面,与这个商空间同构的一维空间是任意一条过零点且不与π平行的直线l

1.3 映射的矩阵

  根据公式(2)的第3式可知,有限维线性空间的线性映射可以由V的一组基完全确定。具体来讲,选择V的一组基α1,,αn,再选择V的一组基β1,,βm,线性映射可以表示成如下表达式。故每个线性映射在选定的基下都确定一个矩阵A,且反之对任意n×m阶矩阵,式子(10)也定义了一个线性变换。所以在有限维空间中,可以把线性映射和矩阵等价看待。这与我们在矩阵乘法中的视角相一致,但要注意AB的矩阵是BA(自行验证)。

(10)A(α1,,αn)=An×m(β1,,βm)

  对于同一个线性映射,选择V,V的不同基,得到的矩阵也是不同的。设(α1,,αn)=P(α1,,αn)(β1,,βm)=Q(β1,,βm)是另一组基,则有式(11)成立,即线性映射的矩阵变为PAQ1。反之对任意n,m阶的可逆方阵P,QB=PAQ1都是同一个线性映射在某组基下的矩阵。满足以上条件的A,B称为是相抵矩阵,显然相抵矩阵是一个等价类,每一个类对应Hom(V,V)中的一个元素。

(11)A(α1,,αn)=PA(α1,,αn)=PA(β1,,βm)=PAQ1(β1,,βm)

  由上一篇的结论知,总存在可逆方阵P,Q,使得PAQ1=[Ir000]。在对应基下,线性映射有了最简单的形式,它也是最本质的形式,同构意义下n维到m维空间的线性映射仅有min(n,m)个。另外,显然A的秩r正是A(V)的维度,故r也称为A的秩,同样记作rankA

  如果把相抵看成是一种变换,我们更关注其中不变的量,比如矩阵的秩,并称之为变换的不变量。不变量是变换或等价类的重要属性,它也是考察变换的主要工具。反之,一旦矩阵的阶和秩确定,它们所属的相抵等价类也就确定了,这样的量可以唯一刻画变换,它被称为变换的全系不变量。关于不变量的讨论将贯穿今后的内容,因为这才是线性代数最精华的部分,全系不变量不仅可以给出变换的简单标准式,还可以对变换进行彻底地分类。

2. 线性变换

2.1 线性变换和相似矩阵

  线性空间V到自身的线性映射也叫线性变换,它们组成的集合简记为Hom(V),由于乘法在其中是封闭的,故它是一个环。恒等变换I将每个元素变换到自身,显然它是环的单位元,故Hom(V)还是含幺环。像这种定义了乘法的线性空间,且乘法满足公式(4)(5)和存在单位元,我们一般称之为域K上的代数。代数是很常见的结构,比如一般的数域、n维方阵、一元多项式等等。

  一一映射的线性变换是可逆映射,它的一般也记作A1。又由于线性变换在乘法上的封闭性,可以很自然地定义它的幂运算(12),且它符合一般幂运算的性质,不再赘述。

(12)A0=I,Am=AAm1,Am=(A1)m

  对n维空间V,线性变换A同样可以对应到n阶方阵A,且变换可逆与矩阵可逆等价。前面已经看到,线性映射是矩阵的直观表示,我们同样可以用线性变换来研究方阵的性质。比如考察序列A,A2,A3,,显然有A(V)A2(V),由于秩不可能无限递减,故存在Ak(V)=Ak+1(V)。一旦出现这种情况,等式会一直成立下去,从而必定有式(13)成立。

(13)An(V)=An+1(V)=,rankAn=rankAn+1=

  既然像和原像在同一空间,对它们选择相同一组基α1,,αn会比较方便,这也是线性变换不同于一般线性映射的根本原因。当取另一组基(α1,,αn)=P(α1,,αn)时,易知线性变换的矩阵变为PAP1。更一般地,如果矩阵A,B满足式(14),则称A,B相似矩阵,记作AB。同样地,相似矩阵的等价类与Hom(V)的元素一一对应。

(14)B=PAP1,|P|0

  下一篇的主要任务将是研究相似矩阵的不变量和全系不变量,以得到相似标准型及相似矩阵的完全分类,这里先做一些准备工作。

2.2 不变子空间

  由于线性变换的像和原像在同一空间,它们总是纠缠在一起,不能像线性映射那样变得简单。但我们还是希望将变换尽量分割开来,具体讲就是,将V分解为尽量小的子空间V1V2Vs,且线性变换的像A(Vi)还在Vi中。这样在对应的基下,变换的矩阵是一个分块对角矩阵。进一步地,如果这样的分割唯一,我们还能对矩阵或变换进行分类。

  为此我们先简单讨论一下这样的子空间W,如果它满足A(W)W,则称之为A不变子空间。显然V本身、变换的核KerA、变换的像A(V)都是不变子空间。根据定义还可以证明,不变子空间的和、交都是不变子空间。另外,如果选取W的一组基并将其扩展成V的基,则显然变换的矩阵是如下分块下三角矩阵,其中rW的维度。

(15)[Xr×r0ZY(nr)×(nr)]

  如果在商空间V/W中定义映射α+WAα+W,首先由于W是不变子空间,易知这是一个良定义。再通过简单的验证可知这个映射是线性变换,它也被称为AV/W上的诱导变换。设W的基为α1,,αr,扩展为V的基为α1,,αn,则可以证明,诱导变换在基αr+1+W,,αn+W下的矩阵正好就是公式(15)中的Y

  其实A(V),KerA为不变子空间这一结论是可以进行扩展的,这里介绍一个十分有用的结论。设线性变换B满足AB=BAVA的不变子空间,容易验证B1(V)B(V)都是A的不变子空间。特别地,如果取B为多项式f(A),并分别取VV0,则有f(A)(V)Kerf(A)都是A的不变子空间。

2.3 循环子空间

  有一种不变子空间比较容易想到,那就是从某个向量α开始“生成”的不变子空间。要使得它是不变子空间,则要求α,A(α),A2(α),都属于这个空间。在有限空间中,这个序列迟早会变得线性相关,设在Am(α)处第一次出现线性相关,则它可以由α,,Am1(α)线性表出(式(16)),而且显然后面所有的向量都可以由这前m个向量线性表出。

(16)Am(α)=am1Am1(α)++a1A(α)+a0α

  这m个向量的生成子空间被称为由α生成的循环子空间,记做Cα(公式(17))。显然Cα的维数是m,且容易证明,它是包含α的最小不变子空间。取这m个向量作为Cα的基,容易验证A|Cα在这组基下的矩阵为式(18)。

(17)Cα=α,A(α),,Am1(α)

(18)[0110a0a1am1]

2.4 特征值和特征向量

  最简单的循环子空间当然就是α的生成子空间α,这时有公式(19)左边的关系。将满足条件的α称为A特征向量,对应的λ称为特征值。这个关系等价于(19)的右式,要使非零的α存在,特征矩阵λIA的行列式必须为0。容易证明它的行列式有式(20)的格式,多项式φ(λ)称为A特征多项式

(19)A(α)=λα(λIA)α=0

(20)|λIA|=φ(λ)=λn(a11++ann)λn1++(1)n|A|

   A,B为复方阵,求证AB,BA的特征多项式相同。

  显然A的所有特征值就是φ(λ)=0的所有根,根λi的重数称为特征值的代数重数。另外容易证明,任意特征值λi的所有特征向量组成一个线性空间,称为特征子空间,记作Vλi,这个线性空间的维数称为特征值的几何重数。当λiλj时,考虑0Vλi+Vλj上的分解(式(21)左),设0=αi+αj,将A作用于两边得式(21)右,联立两个等式知αi=αj=0。从而VλiVλj=0,从而可知任意两个特征子空间都不相交。

(21)0=αi+αj;0=λiαi+λjαj

  这样就可以选取各特征子空间的基并将其扩展为空间的集,线性变换在这组基下的矩阵具有以下形式,其中n1,,ns为特征值的几何重数。通过这个式子可以看到几何重数不大于代数重数,当所有几何重数等于代数重数时,矩阵就成为对角矩阵,这样的矩阵也称为可对角化的。反之也显然,可对角化矩阵的几何重数与代数重数都相等,它们是等价的。

(22)[λ1In1000000λsIns0B1Bs1Bs]

  你可能注意到,特征值、特征向量、特征多项式在某个线性变换下都是确定的,故它们是矩阵相似变换下的不变量。但它们并不一定是全系不变量。因为即使有了特征值,矩阵(22)还是不确定的。当然矩阵可对角化时,特征值完全确定了矩阵,这时特征值就是矩阵在相似变换下的全系不变量。另外要注意,特征值的个数与域K的选取有关,我们不妨先在代数闭域(对应数域中的复数域)中进行讨论,因为在代数闭域中所有多项式都能分解为一次多项式之积(λλ1m1)(λλsms)

  在这种假设下,首先由公式(18)知道所有特征值(包括重根)的积为(1)n|A|,而它们的和则为a11++ann,由于特征值是不变量,所以对角线之和也是不变量。另外,任何矩阵都有特征值和特征向量,随便选取一对便得到相似矩阵[λ10CB]。继续对B进行类似的处理,就可以得到一个下三角相似矩阵,而对角线上正是所有特征值,且每个特征值的个数与其代数重数相同。

posted on   卞爱华  阅读(3273)  评论(0编辑  收藏  举报

编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架

导航

点击右上角即可分享
微信分享提示