【高等代数】03 - 二次型和矩阵的分解

  线性函数也是线性代数的重点知识,尤其是双线性函数,本质上定义了向量之间的二元运算。然后在非退化线性替换下,引出了矩阵的合同关系B=PAP(记作AB),类似于线性变换的标准型讨论,这里同样需要讨论合同关系下的等价类和标准型。对称双线性函数是最常见的向量运算,它的度量矩阵是对称矩阵,利用初等变换和归纳法,不难证明任何数域上的对称矩阵都合同于一个对角矩阵。这个结论为对称矩阵的讨论提供了非常便利的方法,而对于实对称矩阵正交分解A=T1DT,更是完美地横跨相似变换和等价变换两个完全不同的领域,这使得实对称矩阵在线性代数中有着重要的位置。

1. 二次型

1.1 惯性指数

  对角线上依次是1,1,0的合同矩阵称为原矩阵的标准型,由初等变换易知复对称矩阵A的标准型是[Ir000],其中rA的秩。当A为实对称矩阵时,它的标准型则为diag{Ir,Is,0},其中r,s分别称为正(负)惯性指数。由于惯性指数的唯一性,再结合对称矩阵的正交变换TDT,可知正负惯性指数分别是A正负特征值的个数。这还说明了,相似变换不改变矩阵的惯性指数。

  由于惯性指数是合同对称矩阵的“完全不变量”,那么对对称双线性函数的讨论完全可以脱离精确的线性函数范畴。尤其是其对称性,使得更简单常用的二次型便可以完全代表原矩阵,而正(负)定矩阵的概念更是根据二次型的特点命名的。现在站在二次型的角度,看看惯性指数还有什么特殊的意义。对二次型f(x1,,xn),假设某个线性替换(不一定非退化)可以把它变成形式(1)左,下面证明pr,qs

(1)f(x1,,xn)=z12++zp2zp+12zp+q2pr,qs

  另外设f(x1,,xn)标准型是y12++yr2yr+12yr+s2,以及HX=Z,GX=Y,则有HG1Y=Z。如果p<r,取Y=(y1,,yr,0,,0),并令Z的前p个元素为0,则由p<r可知这样的Y0是存在的。但这时f(Y)>0f(Z)0,矛盾,这就证明了pr,同样可以证明qs。这个结论说明惯性指数是所有“标准型”中±1个数最少的。

  要知道实对称矩阵的惯性指数,一般要计算所有特征值,计算复杂度较高。参考下面的2.1段,可知顺序主子式不为0的矩阵,可以有分解A=RDR,其中R为对角全为1的上三角矩阵,D为对角非零的对角矩阵。且其中A的顺序主子式和D的顺序主子式完全相同,而D的惯性指数显然可以由顺序主子式完全确定,最终就是说A的惯性指数它的顺序主子式完全确定。完整地讲,如果A的顺序主子式Ak都非零,则序列1,A1,A2,,An的变号次数就是A的负惯性指数,不变号次数就是正惯性指数。

1.2 (半)正定矩阵

  正负惯性指数中有一项为0时,二次型在所有非零向量上表现出明显的符号特点(恒正、恒负、非正、非负),它们分别称为正定、负定、半负定、半正定,对应的矩阵也有相应的名称。尤其正定矩阵的恒正性,使得他很适合用来作为向量的度量,来定义向量的范数和距离。另外,对这类矩阵(二次型)的讨论有着非常实际的意义,由于对称性,这里仅讨论正定矩阵和半正定矩阵。

  注意到正定矩阵合同于单位矩阵I,也就是说正定矩阵存在分解A=CC,其中C可逆。也可以换个说法,存在可逆矩阵C可把正定A对角化为CAC=I。对另外任意的实对称矩阵BCBC仍然是实对称矩阵,故存在实正交矩阵T,使得TCBCT=D=diag{μi}

  设P=CT,则有结论:当A为正定矩阵,B为实对称矩阵时,存在实可逆矩阵P使得PAP=I,PBP=D。这时容易有式(2)成立,当B是半正定矩阵时有μi0,从而得到|A+B||A|+|B|,其中等号成立的充要条件是B=0

(2)|A+B|=|P1|2i=1n(1+μi);|A|+|B|=|P1|2(1+i=1nμi)

  现在考察正定矩阵A=[BCCD],用初等变换可将它对角化为[B00DCB1C],从而B,D,DCB1C都是正定矩阵。另一方面有式(3)左成立,再由刚才的不等式可有式(3)右成立,从而对正定矩阵A,总有估计式|A|aii成立。

(3)|BCCD|=|B||DCB1C||B||D|

1.3 判定条件

  正定(半正定)矩阵的典型特点就是,它的合同对角矩阵的对角元为正数(非负),故它的行列式为也为正数(非负)。再从二次型的角度考察正定(半正定)矩阵A,它使得任意XAX为正数(非负)。取X为某k个维度的向量(其它nk个维度为0),XAX仍然是正定(半正定)的,其对应的行列式是A的一个主子式,这就证明了正定(半正定)矩阵的所有主子式为正数(非负)。

  反之,对所有主子式为正数(非负)的实对称矩阵A,如果它不是正定(半正定)的,则存在特征值λ<0。现在来考察特征多项式f(λ),前面知道它的每一项是(1)kλnkBk,其中BkA的所有k阶主子式之和。由于Bk不可能全部为0(除非全0矩阵,而它是半正定的),故有f(λ)0,这与λ是特征值矛盾,从而证明了逆命题也成立。

  以上证明了正定(半正定)矩阵的充要条件是所有主子式为正数(非负)。2.1节中还有结论:顺序主子式皆非零的实对称矩阵,它的惯性指数由顺序主子式完全确定,从而对于正定矩阵而言,它的充要条件可以弱化为顺序主子式皆为正数。但要注意顺序主子式皆非负,并不是半正定的充分条件,最简单的反例就是[0001]

  除了以上正定的充要条件,有时也可以综合正定矩阵的性质来判定。正定矩阵的一个典型特点是它合同于单位矩阵I,由此它可以分解为PP,其中P可逆。设A,B皆为正定矩阵,来考察AB的正定的充要条件,首先必须得有AB对称,由此可以推出AB=BA。反之如果AB对称,设A=CC,其中C可逆,则C1ABC=CBC。由B正定知CBC正定,所以它的特征值皆为正,从而AB的特征值也为正,证得AB正定。

   再看一个复杂一点的情况,假设A,B正定,考察矩阵C={aijbij}。设B有正交分解TDT,其中D=diag{μi}μi>0B的特征向量。这样可有bij=kμktkitkj,这样可有C=kμkCk,其中Ck=[tkitkjaij]。对任意列向量XXCkX=δkAδk,其中δk=[tk1x1,,tknxn]。易知δk不全为0,从而XCX=kμkXCkX>0,这就证明了C也是正定矩阵。

1.4 实可逆矩阵

  前面提到,任何正定矩阵都可以分解为CC,其中C是实可逆矩阵。反之,对任意实矩阵C(不一定是方阵),来考察对称矩阵CC。设有CCα=λα,两边左乘α得到|Cα|2=λ|α|2,从而可以得到λ0。即CC是半正定矩阵,尤其当CC可逆时,它还是正定矩阵。

  另外,如果令方阵C有特征值μ和特征向量α,则αCCα=μ2|α|2。再由上一篇式(18)可得αCCα[λ1,λn]|α|2,其中λ1,λnCC的最小(大)特征值,从而μ2[λ1,λn]。由于CC的特征值非负,则可以得到估算式λ1|μ|λn。当C可逆时,由于A=CC为正定矩阵,由1.2节的估计式可得到|C|2=|CC|iaii,其中aii=jcji2,这就得到式(4)的Hadamard不等式

(4)|C|0|C|2i=1nj=1ncij2

2. 矩阵的分解

  矩阵的分解是矩阵计算的主要课题,它的任务是把一般性的矩阵分解为一些特殊矩阵(对角矩阵、三角矩阵、正交矩阵等)的乘积、或特殊形式的乘积(相似、合同等)。这不仅能帮助分析矩阵的本质,分解得到的特殊矩阵还能便于计算、分析复杂的表达式。这里再举一些一般性的例子,在“矩阵计算”(也叫“矩阵分析”)这门课中,我们会见到更广泛的应用。

2.1 初等矩阵分解

  先来看一个基础的,我们知道任何可逆矩阵都可以通过初等变换变成I,这就是说可以矩阵都可以分解为一些初等矩阵的乘积(P(j,i(k)),P(i(k)),P(i,j))。另外由式(5)可知,P(i,j)可以由其它两个初等矩阵表示,从而可逆矩阵都可以表示为两类初等矩阵之积(P(j,i(k)),P(i(k)))。其实不难发现,只用P(j,i(k))就可以把A对角化,且除了最后一个ann外都可以化为1,也就是说P(i(k))只要在最后出现一下就可以了。特别地,当|A|=1时,连最后这个P(n(1/|A|))都不需要,A可以拆分为若干P(j,i(k))之积。

(5)P(i,j)=P(i,j(1))P(j,i(1))P(i,j(1))P(i(1))

  继续加强以上条件,先假设a110,那么可以只用下三角的P(j,i(k)),将A的第一列的后n1个数变成0。如果变换后的a220,这个过程还可以继续下去,直到把A变成一个上三角矩阵U。注意到这样的变换并不改变顺序主子式的值,从而加入的一系列条件等价于A的所有顺序主子式都不为0。而根据所有P(j,i(k))变换特点,可知它们组合后的矩阵B是一个下三角矩阵,且对角线皆为1

  结论可以总结为:如果A的所有顺序主子式都不为0,则存在下三角矩阵B和上三角矩阵U,使得BA=U。从而矩阵A有分解A=LU,其中L=B1为对角全为1的下三角矩阵(单位下三角矩阵),U是可逆上三角矩阵。满足条件的矩阵A显然都存在LU分解,并且用反证法还可知这样的分解是唯一的。设有两个分解L1U1=L2U2,则有L21L1=U2U11。等式左边是单位下三角矩阵,右边为上三角矩阵,从而等式为单位矩阵,进而有L1=L2,U1=U2,故LU分解唯一。

  当以上结论作用于有同样性质(顺序主子式非零)的对称矩阵A时,同样可得到唯一分解A=LDL,其中L同上、D为可逆对角矩阵。这个结论在第一段中已经被使用过两次,请再回头品味它的应用。

  关于初等变换,当然还有一个浅显的结论值得一提。对于一般的矩阵Am×n,通过初等变换可以把它变成[Ir000]的形式。这就是说Am×n可以分解为Pm[Ir000]Qn,其中P,Q可逆、rA的秩。

2.2 正交分解

  根据Schmidt正交化方法可知,任何可逆矩阵A都可以分解为QR,其中Q为正交矩阵、R为上三角矩阵,这样的分解称为QR分解。另外,假设存在两个不同的分解Q1R1=Q2R2,则有Q21Q1=R1R21,等式左边是正交矩阵,右边为上三角矩阵。而显然三角正交矩阵只能是I,故有Q1=Q2,R1=R2,这说明QR分解是唯一的。其实对于一般的列满矩阵Am×n,一样可以证明它有唯一分解Qm×nRn,其中Q为列满秩矩阵,R为上三角方阵。

  对于任意复矩阵A,先找到任意特征值λ及特征向量α,将α单位化并开展为正交基{η1,,ηn}。考察正交矩阵T0=[η1,,ηn]下的正交变换B=T01AT0,易知B有形式[λβ0C]。利用归纳法可以证明,A正交相似于一个上三角矩阵U,即存在正交矩阵T使得A=T1UT

  对任意实矩阵A,如果假设它的特征值都是实数,类似刚才的推论可以得到相同的结论。这时如果再附加对称的条件,则同样证得A正交相似于对角矩阵。这是我们熟悉的结论,这里从另一个视角再看到它。当然这个条件也可以以其它形式给出,比如假设AA=AA(正规矩阵),可以得到UU=UU,依次对比等式两边的对角线可知U为对角矩阵(从而A为对称矩阵)。

2.3 正定矩阵的分解

  由于实对称矩阵可以有正交变换A=T1DT,如果A正定,则可以有拆分D=D02,其中D0=diag{λi}。这样就可以说正定矩阵可以有分解A=C2,其中C为正定矩阵。C=T1D0T是显然的一个分解(A=C2),那它是不是唯一分解呢?设有两种分解C1=T11D1T1,C2=T21D2T2,由C12=C22可得D12S=SD22,其中S=T1T21为正交矩阵。这样就有d1i2sij=sijd2j2,不管怎样都有d1isij=sijd2j,从而D1S=SD2。再按原路返回便得到C1=C2,分解的唯一性得证。

  另外,当A为实可逆矩阵时,AA是正定矩阵,从而可以有唯一分解AA=S12,其中S1是正定矩阵。容易验证(A)1S1是正交矩阵,从而存在分解A=TS1,其中T为正交矩阵。取S2=TS1T1,则有A=S2T,其中S2也是正定矩阵。另外不难证明S1,S2的唯一性,从而得到极分解定理:实可逆矩阵有唯一分解A=TS1=S2T,其中T为正交矩阵、S1,S2为正定矩阵。进一步地,可以将S1进行正交分解,从而实可逆矩阵A有分解T1DT2,其中T1,T2为正交矩阵、D=diag{λi}λiAA特征值)。

2.4 矩阵分解总结

  以下式(6)~(11)总结了至今讲到的重要矩阵分解,其中P是可逆矩阵、T,Q是正交矩阵、S为正定矩阵、L为对角线全为1的下三角矩阵、U,R为可逆上三角矩阵,=表示分解唯一。D为对角矩阵,其中式(8)中D的对角元素为所有特征值,(11)式中D可逆。

(6)|A|0A=QR=TS1=S2T=T1DT2

(7)A=AA=PDP

(8)A=A,ARn×nA=TDT

(9)AI,ARn×nA=PP=S2

(10)Ak=|a11a1kak1akk|0,(k=1,,n)A=LU

(11)A=A,Ak0A=LDL

posted on   卞爱华  阅读(3647)  评论(0编辑  收藏  举报

导航

点击右上角即可分享
微信分享提示