【线性代数】 06 - Jordan标准型

  现在就来研究将空间分割为不变子空间的方法,最困难的是我们还不知道从哪里着手。你可能想到从循环子空间出发,一块一块地进行分割,但这个方案的存在性和唯一性都不能解决。不变子空间分割不仅要求每个子空间V是不变的,还隐含要求V之外元素的像不落在V中,这一条就导致从局部开始分割的方案是行不通的。另外,这种方法也无法保障分割的唯一性,因为分割过程依赖每个子空间的选取。

1. 化零多项式

  看来还是得从全局出发,期望找到某个属性,它能将空间完美分割。那么首先要将整个空间V放置在A的某个属性下,然后按这个属性再进行细分。这一步该如何跨出是很艰难的,想必历史上也并不是一蹴而就得来的。前面我们已经做了一些简单的铺垫,最重要的一个是,变换的多项式所具有的不变子空间。你可能问过自己,对一般的变换,是否有对其成立的恒等式?如果可以在多项式中找到这个等式就更好了。

  想法是很好的,但在走向结论时却需要一个巧妙的构造,我不知道数学家们是如何得到的,毕竟自己的素养还不够。回顾特征矩阵λIA,你既可以把它看成是矩阵系数的多项式,也可以看成是以多项式为元素的矩阵。但在所有的变形中,其实我们默认λ是域K中的元素,而不是任意的不定元。所以变形得到的等式也不能草率地当作一般多项式看待,尤其不能随便用一个矩阵带入到式子中,这一点一定要弄清楚。

  但庆幸的是,还真有一个特殊情况,矩阵是可以代入多项式等式的。考察特征矩阵的任意一个等式(1),展开左式并对应到右式,得到一系列等式(2)。等式两边分别乘上I,A,A2,并相加,就得到0=f(A),这就仿佛是将矩阵A代入了等式(1)。但这种代入一般是很难成立,它是得益于特征矩阵的特殊形式,我们可以把这个有趣的性质当做结论,

(1)(λIA)g(λ)=(λIA)(λmBm+λm1Bm1++B0)=λnCn+λn1Cn1++C0=f(λ)

(2)AB0=C0;B0AB1=C1;B1AB2=C2;Bn1ABn=Cn;BnABn+1=0;Bm=0

  特别地,取g(λ)λIA的伴随矩阵,等式右边就是φ(λ)I,从而有Hamilton-Caylay定理成立(公式(3),请参考抽象代数多项式里的余数定理)。定理的线性变换形式是φ(A)=0,这个公式对整个空间V都成立,或者说V是变换φ(A)的核,我们就从这里开始寻找进一步的结论。

(3)φ(λ)=|λIA|φ(A)=0

  更一般地,满足f(A)=0的多项式称为A化零多项式,其中次数最小的首一多项式叫做A最小多项式,记作d(λ)。这些定义对矩阵同样成立,而且显然最小多项式也是相似变换的不变量。类似抽象代数中的分析,容易知道最小多项式是唯一的,且它整除所有的化零多项式,从而有d(λ)φ(λ)

   特征多项式和最小多项式还有一个有趣的应用,先给它们一个统一的形式f(λ)=λn+an1λn1++a0,则f(A)=0。对可逆矩阵A,易知a00,将a0I移到等式右边,左边提取出A便有等式(4)成立。根据这个等式可以比较容易地计算A1

(4)A(An1+an1An2++a1I)=a0I

   求证:循环子空间的特征多项式即最小多项式,并求上一篇中式(18)的特征多项式。

2. 根子空间

  更一般地,我们考察任何多项式f(λ),设它有互质分解f(λ)=f1(λ)f2(λ),即有式(5)成立。考察不变子空间W=Kerf(A)Wi=Kerfi(A),首先显然有WiW。对任何αW,有f1(A)f2(A)(α)=0,再由公式(5)知α可按式(6)进行分解,但显然αiWi,所以有W=W1+W2

(5)g1(λ)f1(λ)+g2(λ)f2(λ)=1

(6)α=g1(A)f1(A)(α)+g2(A)f2(A)(α)=α2+α1

  现在设βW1W2,再次用公式(5)有β=g1(A)f1(A)(β)+g2(A)f2(A)(β)=0,从而W1W2=0,这就是说W=W1W2。以此归纳,如果f(λ)有互质分解f1(λ)f2(λ)fs(λ),则有公式(7)成立。

(7)Kerf(A)=Kerf1(A)Kerf2(A)Kerfs(A)

  现在来看最小多项式d(λ),在代数闭域(复数域)中有互质分解(8),将公式(7)应用到式(8)便有式(9)成立。其中Wi都是不变子空间,这就找到了我们所要的分割。虽然这个分割保证了存在性和唯一性,但还没有达到最小分割,相似矩阵也没有找到简单的标准型,这个任务到下一段再解决。

(8)d(λ)=(λλ1)r1(λλ2)r2(λλs)rs

(9)V=Wλ1Wλ2Wλs,Wλi=Ker(AλiI)ri

  有些细节我们还需要再讨论一下,最小多项式和特征多项式有什么关系?最小究竟是什么最小?特征多项式根的重数又代表什么?首先易知Wλi都不为零,否则d(λ)去掉(λλi)ri后仍然是化零多项式,这与最小多项式矛盾。Wλi非零等价于说AλiI不是满秩的,从而λiA的特征值。反之根据公式(9)知,λ1,,λs包含了所有A的特征值,否则直和包含不了所有的特征子空间。从而最小多项式与特征多项式有完全一样的根,且由整除性知,特征多项式根的重数不小于最小多项式根的重数(公式(10))。

(10)φ(λ)=(λλ1)t1(λλ2)t2(λλs)ts,tiri>0

  现在设Uk=Ker(AλiI)k,显然U1就是λi的特征子空间,并且有U1U2U3。这个序列不会无穷递增,且容易证明等式一旦Um=Um+1成立,等式会一直成立。如果m>ri,则UmWλiUm与其它Wλ无交集,这与公式(9)矛盾。如果m<ri,则Um=Wλi,带入公式(9)容易证明,将d(λ)中的(λλi)ri换成(λλi)m后仍然是化零多项式,这与最小多项式矛盾。

  从而正好有m=ri,这就找到了最小多项式根的重数的意义(公式(11)),为此也称Wλiλi根子空间。把Wλi简记为W,显然线性变换AW下的限制A|W也是线性变换,且由定义知该限制的最小多项式是(λλi)ri。由公式和(9)和(10)的结论知,A|W的特征多项式正是(λλi)ti,从而间接说明了Wλi的维数是ti,这就是特征多项式根的重数的意义(公式(12))。

(11)Ker(AλiI)Ker(AλiI)ri=Ker(AλiI)ri+1=

(12)dimWλi=ti

3. 幂零变换

  由W的定义可知,ri是使得(AλiI)k|W=0的最小整数k。为此我们定义满足Ar=0,Ar10的线性变换为r幂零变换,从而AλiI|Wri次幂零变换。如果能找到幂零变换的简单相似矩阵S,则就可以有A的简单相似矩阵S+λiI,下面来着手解决这个问题。

  幂零变换在任何子集的限制下仍然是幂零的,故任何不变子空间的最小多项式都是λm=0的形式。特别地,m阶循环子空间的特征多项式和最小多项式都是λm=0,这样的循环子空间也叫强循环子空间。容易知道,强循环子空间的变换矩阵为式(13),而且它的k次幂正好是将In的对角线向右上角移动k次,故有rankJnk=nk,直至Jnn=0

(13)Jn=[0110]

  设An维空间V上的m次幂零变换,当n=1时显然有A=0,结论比较平凡。当n=2时,m可以取12m=1时为平凡变换A=0m=2时存在α使得Aα0,且α,Aα线性无关,所以V其实是一个2维强循环子空间。反过来再看m=1的情况,V其实就是两个1维强循环子空间的直和。总结就有:n维空间在幂零变换下可以分解为l个强循环子空间的直和,其中lKerA的维数。

  设以上结论对k<n维空间成立,下面用归纳法来证结论对n维空间也成立。先记W=KerA,对A=0的平凡场景结论明显成立,当A0W0且维度s<n。首先容易证明,V/WA上的诱导变换也是幂零变换,由归纳假设,它有如式(14)的直和分解。且由上一篇的结论我们知道,陪集的代表元和W的基正好是V一组完整的基,故有式(15)成立。

(14)As11α1+W,,α1+WAst1αt+W,,αt+W

(15)V=WU,U=As11α1,,α1,,Ast1αt,,αt

  由于式(14)中每个子集在诱导映射下都是强循环子空间,故有AsiαiW。考察它们的相关性,设k1As1α1++ktAstαt=0,即有式(16)成立,故βW,而显然βU。由式(15)知β=0,所以ki=0Asiαi线性无关。

(16)Aβ=0,β=k1As11α1++ktAst1αt

  将Asiαi扩展为W的一组基As1α1,,Astαt,γ1,,γr,考虑到Asiαi,,αiγj都是强循环子空间,故V可以分解为如式(17)强循环子空间的直和。更一般地描述为公式(18)(19),其中每个强循环子空间的阶数si+1不大于幂零变换的次数m

(17)V=As1α1,,α1Astαt,,αtγ1γr

(18)V=As1α1,,α1Aslαl,,αl

(19)l=dim(KerA)=nrankA

  进一步,根据Jn的特点,我们其实还可以具体求得k(1km)阶循环子空间的个数N(k)。首先显然有公式(20)的系列等式成立,通过简单的计算可以得到公式(21),这个公式说明了幂零矩阵分解得到的循环子空间的个数和次数都是确定的,也可以说这种分解是唯一的。

(20)rankA0=N(1)1+N(2)2++N(m)mrankA1=N(2)1+N(3)2++N(m)(m1)rankA2=N(3)1+N(4)2++N(m)(m2)

(21)N(k)=rankAk12rankAk+rankAk+1

4.  Jordan标准型及其计算

4.1 Jordan标准型

  现在回到线性空间V在一般线性变换A下的分解,前面已经知道,它可以按照特征值分解为几个根子空间Wλi,而根子空间在变换AλiI下又是幂零变换。幂零变换的分解上面也彻底解决,结合这两种分解容易知道,线性变换A的矩阵相似于如下矩阵。其中对角线都是特征值,每个特征值的个数正是它的代数重数,去掉对角线后就是对应幂零变换的分解。

A[Jn11(λ1)Jn1k1(λ1)Jns1(λs)Jnsks(λs)],Jn(λ)=[λ11λ]n×n

  这个矩阵称为Jordan标准型,其中每一个矩阵块Jn(λ)也叫Jordan块。不过要注意,我们讨论根子空间的完全分解时,是在代数闭域(复数域)中进行的,所以只能说任何矩阵在代数闭域中相似于一个Jordan标准型。但其实对具体的矩阵,这个条件可以弱化为:域是变换的特征多项式的正规扩域(在域中可完全分解)。

4.2 λ-矩阵和初等因子

  那么具体如何求Jordan标准型呢?只需先求得所有特征值,再利用公式(21)求每个Jordan块的阶数,具体过程就不赘述了。这个方法的计算复杂度较高,我们需要研究别的方法。通过结论我们已经知道,Jordan标准型由特征值和每个Jordan块的阶数nikj完全决定,这些参数就是矩阵相似意义下的全系不变量。为了求得标准型,需要设计一个全系不变量,它包含了所有这些参数。

  现在能想到的最接近的量就是特征多项式(10)了,它包含了所有特征值和每个特征值的代数重数,要想得到更完整的参数,我们不妨把目光放到特征多项式的源头上:特征矩阵λIA。为此先讨论更一般的、以域F上的多项式f(λ)为元素的矩阵A(λ),并称之为λ-矩阵。这样的矩阵同样可以定义它的秩和逆矩阵,只不过逆矩阵只有在其行列式为常数时才存在。

  λ-矩阵同样可以进行初等变换并定义初等矩阵:P(i,j),P(i,j(f(λ))),P(i(k)),但要注意,为了使初等变换可逆,每一行(列)只允许乘以非零常数kF。在抽象代数中我们知道,域上多项式环是一个欧式环,其上可以定义最大公约数(首项系数为1),还可以进行辗转相除法。设A(λ)非零元素的最大公约数为d1(λ),可以证明初等变换能把A(λ)转换成[d1(λ)00A1(λ)],其中A1(λ)的元素都是d1(λ)的倍数。继续这个过程可以将A(λ)转换为如下Smith标准型,其中r显然为A(λ)的秩。

(22)[d1(λ)dr(λ)0],di(λ)di+1(λ)

  类似于一般矩阵,我们将可以通过初等变换互相转换的λ-矩阵称为相抵的,所以任何λ-矩阵都相抵于式(22)中的矩阵。另外显然可逆λ-矩阵相抵于单位矩阵,也就是说可逆λ-矩阵可以分解为一系列初等矩阵相乘,这样A(λ)B(λ)相抵其实等价于:存在可逆λ-矩阵P(λ),Q(λ),使得公式(23)成立。

(23)B(λ)=P(λ)A(λ)Q(λ)

  对于一般矩阵的相抵,秩r完全确定了一个等价类,它是相抵矩阵的全系不变量。由于初等变换不改变元素的最大公约数,故式(22)中的di(λ)其实是确定的,它们也是相抵λ-矩阵的全系不变量,被称为λ-矩阵的不变因子。现在回到特征矩阵A(λ)=λIAn,并设A的元素在代数闭域F中,由于其行列式φ(λ)非零,所以A(λ)是满秩的。由于相抵λ-矩阵的行列式不变,故有式(24)成立。

(24)φ(λ)=d1(λ)d2(λ)dn(λ),di(λ)=(λλ1)ei1(λλs)eis

  首先显然有(25)左式成立(tiλi的代数重数),再由di(λ)di+1(λ)可知还有(25)右式成立。由于di(λ)是全系不变量,故所有(λλj)eij其实是完全确定的,其中不为1那些项被称为特征矩阵的初等因子。显然所有初等因子组成的集合也是特征矩阵的全系不变量,被称为初等因子组

(25)ti=e1i+e2i++eni,e1ie2ieni

4.3 相似与相抵

  现在你可能眼前一亮,初等因子和Jordan块有什么关系?它们是不是一一对应的?我们费这么大劲讨论初等因子,当然是有目的的。正如你所料,它们之间存在着对应关系,我们需要两个结论来得到这样的关系。

  先来看看Jordan标准型的初等因子是什么,讨论中只需进行简单的初等变换即可,过程就不细说了。第一步要证明Jordan块Jn(λ0)的初等因子只有(λλ0)n,第二步证明分块对角矩阵[AB]的初等因子是A,B初等因子之并,第三步就推导出Jordan标准型(23)的初等因子正是所有Jordan块的初等因子。

  这样一来,要求矩阵A的Jordan标准型J,只需求J的初等因子。但我们手上只有A,并且知道它与J相似,你自然想问,λIAλIJ的初等因子有什么关系呢?更一般地,设AB,即存在可逆矩阵P,使得A=PBP1。那么有λIA=λIPBP1=P(λIB)P1,从而λIAλIB相抵。这就说明了相似矩阵的特征矩阵是相抵的,对应的初等因子也相同。以上结论就将求解矩阵A的Jordan标准型的问题,转化成了求λIA初等因子的问题。

  其实反过来,如果λIAλIB相抵,它们的初等因子相同,从而A,B的Jordan标准型相同,这就有AB。所以矩阵相似和特征矩阵相抵是等价的,初等因子是相似或相抵的全系不变量。这里再介绍一个证明必要性的方法,它对任何数域都成立,证明的步骤还可以用来求过渡矩阵。设存在可逆λ-矩阵P(λ),Q(λ),使得λIA=P(λ)(λIB)Q(λ),即(λIA)Q1(λ)=P(λ)(λIB)=λP(λ)P(λ)B。根据公式(1)的结论将A带入等式得到式(26),这也证明了AB,且过渡矩阵为P(λ)

(26)A=P(A)BP1(A)

   求证:复方阵A相似于它的转置A,并求过渡矩阵;

   利用Jordan标准型求复方阵的最小多项式。

5. 实方阵的标准型

  相对来说,实方阵其实更常用,虽然它不一定能有Jordan标准型,但我们还是可以得到一些有用的结论。当然实方阵只是复方阵的一个特例,充分利用复方阵的已有结论会简化很多讨论。先来看两个在复数域上相似的实方阵A,B,则存在实方阵P,Q使得下式成立左边,化简得到AP=PB,AQ=QB,并进而有右边成立。

(27)A=(P+iQ)B(P+iQ)1A(P+λQ)=(P+λQ)B

  设φ(λ)=|P+λQ|,因为φ(i)0,故φ(λ)非零。从而必定有实数λ0使得φ(λ0)0,这时P+λ0Q可逆,从而有式(28)成立。这就说明了A,B是实相似的,反之如果A,B实相似,它们当然复相似,所以实方阵的实相似和复相似是等价的。这个结论告诉我们,想要讨论式方阵的“标准”实相似方阵,其实只需要找到与Jordan标准型复相似的“标准”实方阵。

(28)A=(P+λ0Q)B(P+λ0Q)1

  我们知道实系数多项式在实数域的因式最多为二次,从而实方阵的特征矩阵在实数域上的初等因子为(λλ0)n或者为(λ2+aλ+b)n。对于后者,它在复数域中表现为成对出现的初等因子(λλ0)n,(λλ¯0)n。为了把这样的初等因子再合并成实数域上的(λ2+aλ+b)n,我们自然考虑将(λλ0)n,(λλ¯0)n的Jordan块进行合并,也就是求与A=[Jn(λ0)Jn(λ¯0)]相似的实方阵。

  如式(29)所示,其实Jordan块还有另一个结构比较好的相似矩阵,这个矩阵使得初等变换很方便。它使得对A相似矩阵的讨论,等价于对B=[λ0Mλ¯0M]相似矩阵的讨论。

(29)[1λ1λ(n1)][λ11λ][1λλ(n1)]=λ[1111]=λMn

  设λ0=ρ(cosθ+isinθ)B的初等因子为λ22ρcosθλ+ρ2=(λρcosθ)2+(ρsinθ)2,容易构造出它也是C=[ρcosθρsinθρsinθρcosθ]的初等因子。这样就有BC,进而我们就得到了与A相似的实方阵(30),最终也就得到实方阵的标准型。

(30)[Jn(λ0)Jn(λ¯0)]ρ[cosθMnsinθMnsinθMncosθMn]

posted on   卞爱华  阅读(7371)  评论(3编辑  收藏  举报

编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库

导航

点击右上角即可分享
微信分享提示