线性函数也是线性代数的重点知识,尤其是双线性函数,本质上定义了向量之间的二元运算。然后在非退化线性替换下,引出了矩阵的合同关系(记作),类似于线性变换的标准型讨论,这里同样需要讨论合同关系下的等价类和标准型。对称双线性函数是最常见的向量运算,它的度量矩阵是对称矩阵,利用初等变换和归纳法,不难证明任何数域上的对称矩阵都合同于一个对角矩阵。这个结论为对称矩阵的讨论提供了非常便利的方法,而对于实对称矩阵正交分解,更是完美地横跨相似变换和等价变换两个完全不同的领域,这使得实对称矩阵在线性代数中有着重要的位置。
1. 二次型
1.1 惯性指数
对角线上依次是的合同矩阵称为原矩阵的标准型,由初等变换易知复对称矩阵的标准型是,其中是的秩。当为实对称矩阵时,它的标准型则为,其中分别称为正(负)惯性指数。由于惯性指数的唯一性,再结合对称矩阵的正交变换,可知正负惯性指数分别是正负特征值的个数。这还说明了,相似变换不改变矩阵的惯性指数。
由于惯性指数是合同对称矩阵的“完全不变量”,那么对对称双线性函数的讨论完全可以脱离精确的线性函数范畴。尤其是其对称性,使得更简单常用的二次型便可以完全代表原矩阵,而正(负)定矩阵的概念更是根据二次型的特点命名的。现在站在二次型的角度,看看惯性指数还有什么特殊的意义。对二次型,假设某个线性替换(不一定非退化)可以把它变成形式(1)左,下面证明。
另外设标准型是,以及,则有。如果,取,并令的前个元素为,则由可知这样的是存在的。但这时而,矛盾,这就证明了,同样可以证明。这个结论说明惯性指数是所有“标准型”中个数最少的。
要知道实对称矩阵的惯性指数,一般要计算所有特征值,计算复杂度较高。参考下面的2.1段,可知顺序主子式不为的矩阵,可以有分解,其中为对角全为的上三角矩阵,为对角非零的对角矩阵。且其中的顺序主子式和的顺序主子式完全相同,而的惯性指数显然可以由顺序主子式完全确定,最终就是说的惯性指数它的顺序主子式完全确定。完整地讲,如果的顺序主子式都非零,则序列的变号次数就是的负惯性指数,不变号次数就是正惯性指数。
1.2 (半)正定矩阵
正负惯性指数中有一项为时,二次型在所有非零向量上表现出明显的符号特点(恒正、恒负、非正、非负),它们分别称为正定、负定、半负定、半正定,对应的矩阵也有相应的名称。尤其正定矩阵的恒正性,使得他很适合用来作为向量的度量,来定义向量的范数和距离。另外,对这类矩阵(二次型)的讨论有着非常实际的意义,由于对称性,这里仅讨论正定矩阵和半正定矩阵。
注意到正定矩阵合同于单位矩阵,也就是说正定矩阵存在分解,其中可逆。也可以换个说法,存在可逆矩阵可把正定对角化为。对另外任意的实对称矩阵,仍然是实对称矩阵,故存在实正交矩阵,使得。
设,则有结论:当为正定矩阵,为实对称矩阵时,存在实可逆矩阵使得。这时容易有式(2)成立,当是半正定矩阵时有,从而得到,其中等号成立的充要条件是。
现在考察正定矩阵,用初等变换可将它对角化为,从而都是正定矩阵。另一方面有式(3)左成立,再由刚才的不等式可有式(3)右成立,从而对正定矩阵,总有估计式成立。
1.3 判定条件
正定(半正定)矩阵的典型特点就是,它的合同对角矩阵的对角元为正数(非负),故它的行列式为也为正数(非负)。再从二次型的角度考察正定(半正定)矩阵,它使得任意为正数(非负)。取为某个维度的向量(其它个维度为),仍然是正定(半正定)的,其对应的行列式是的一个主子式,这就证明了正定(半正定)矩阵的所有主子式为正数(非负)。
反之,对所有主子式为正数(非负)的实对称矩阵,如果它不是正定(半正定)的,则存在特征值。现在来考察特征多项式,前面知道它的每一项是,其中是的所有阶主子式之和。由于不可能全部为(除非全矩阵,而它是半正定的),故有,这与是特征值矛盾,从而证明了逆命题也成立。
以上证明了正定(半正定)矩阵的充要条件是所有主子式为正数(非负)。2.1节中还有结论:顺序主子式皆非零的实对称矩阵,它的惯性指数由顺序主子式完全确定,从而对于正定矩阵而言,它的充要条件可以弱化为顺序主子式皆为正数。但要注意顺序主子式皆非负,并不是半正定的充分条件,最简单的反例就是。
除了以上正定的充要条件,有时也可以综合正定矩阵的性质来判定。正定矩阵的一个典型特点是它合同于单位矩阵,由此它可以分解为,其中可逆。设皆为正定矩阵,来考察的正定的充要条件,首先必须得有对称,由此可以推出。反之如果对称,设,其中可逆,则。由正定知正定,所以它的特征值皆为正,从而的特征值也为正,证得正定。
再看一个复杂一点的情况,假设正定,考察矩阵。设有正交分解,其中,是的特征向量。这样可有,这样可有,其中。对任意列向量,,其中。易知不全为,从而,这就证明了也是正定矩阵。
1.4 实可逆矩阵
前面提到,任何正定矩阵都可以分解为,其中是实可逆矩阵。反之,对任意实矩阵(不一定是方阵),来考察对称矩阵。设有,两边左乘得到,从而可以得到。即是半正定矩阵,尤其当可逆时,它还是正定矩阵。
另外,如果令方阵有特征值和特征向量,则。再由上一篇式(18)可得,其中是的最小(大)特征值,从而。由于的特征值非负,则可以得到估算式。当可逆时,由于为正定矩阵,由1.2节的估计式可得到,其中,这就得到式(4)的Hadamard不等式。
2. 矩阵的分解
矩阵的分解是矩阵计算的主要课题,它的任务是把一般性的矩阵分解为一些特殊矩阵(对角矩阵、三角矩阵、正交矩阵等)的乘积、或特殊形式的乘积(相似、合同等)。这不仅能帮助分析矩阵的本质,分解得到的特殊矩阵还能便于计算、分析复杂的表达式。这里再举一些一般性的例子,在“矩阵计算”(也叫“矩阵分析”)这门课中,我们会见到更广泛的应用。
2.1 初等矩阵分解
先来看一个基础的,我们知道任何可逆矩阵都可以通过初等变换变成,这就是说可以矩阵都可以分解为一些初等矩阵的乘积()。另外由式(5)可知,可以由其它两个初等矩阵表示,从而可逆矩阵都可以表示为两类初等矩阵之积()。其实不难发现,只用就可以把对角化,且除了最后一个外都可以化为,也就是说只要在最后出现一下就可以了。特别地,当时,连最后这个都不需要,可以拆分为若干之积。
继续加强以上条件,先假设,那么可以只用下三角的,将的第一列的后个数变成。如果变换后的,这个过程还可以继续下去,直到把变成一个上三角矩阵。注意到这样的变换并不改变顺序主子式的值,从而加入的一系列条件等价于的所有顺序主子式都不为。而根据所有变换特点,可知它们组合后的矩阵是一个下三角矩阵,且对角线皆为。
结论可以总结为:如果的所有顺序主子式都不为,则存在下三角矩阵和上三角矩阵,使得。从而矩阵有分解,其中为对角全为的下三角矩阵(单位下三角矩阵),是可逆上三角矩阵。满足条件的矩阵显然都存在LU分解,并且用反证法还可知这样的分解是唯一的。设有两个分解,则有。等式左边是单位下三角矩阵,右边为上三角矩阵,从而等式为单位矩阵,进而有,故LU分解唯一。
当以上结论作用于有同样性质(顺序主子式非零)的对称矩阵时,同样可得到唯一分解,其中同上、为可逆对角矩阵。这个结论在第一段中已经被使用过两次,请再回头品味它的应用。
关于初等变换,当然还有一个浅显的结论值得一提。对于一般的矩阵,通过初等变换可以把它变成的形式。这就是说可以分解为,其中可逆、为的秩。
2.2 正交分解
根据Schmidt正交化方法可知,任何可逆矩阵都可以分解为,其中为正交矩阵、为上三角矩阵,这样的分解称为QR分解。另外,假设存在两个不同的分解,则有,等式左边是正交矩阵,右边为上三角矩阵。而显然三角正交矩阵只能是,故有,这说明QR分解是唯一的。其实对于一般的列满矩阵,一样可以证明它有唯一分解,其中为列满秩矩阵,为上三角方阵。
对于任意复矩阵,先找到任意特征值及特征向量,将单位化并开展为正交基。考察正交矩阵下的正交变换,易知有形式。利用归纳法可以证明,正交相似于一个上三角矩阵,即存在正交矩阵使得。
对任意实矩阵,如果假设它的特征值都是实数,类似刚才的推论可以得到相同的结论。这时如果再附加对称的条件,则同样证得正交相似于对角矩阵。这是我们熟悉的结论,这里从另一个视角再看到它。当然这个条件也可以以其它形式给出,比如假设(正规矩阵),可以得到,依次对比等式两边的对角线可知为对角矩阵(从而为对称矩阵)。
2.3 正定矩阵的分解
由于实对称矩阵可以有正交变换,如果正定,则可以有拆分,其中。这样就可以说正定矩阵可以有分解,其中为正定矩阵。是显然的一个分解(),那它是不是唯一分解呢?设有两种分解,由可得,其中为正交矩阵。这样就有,不管怎样都有,从而。再按原路返回便得到,分解的唯一性得证。
另外,当为实可逆矩阵时,是正定矩阵,从而可以有唯一分解,其中是正定矩阵。容易验证是正交矩阵,从而存在分解,其中为正交矩阵。取,则有,其中也是正定矩阵。另外不难证明的唯一性,从而得到极分解定理:实可逆矩阵有唯一分解,其中为正交矩阵、为正定矩阵。进一步地,可以将进行正交分解,从而实可逆矩阵有分解,其中为正交矩阵、(为特征值)。
2.4 矩阵分解总结
以下式(6)~(11)总结了至今讲到的重要矩阵分解,其中是可逆矩阵、是正交矩阵、为正定矩阵、为对角线全为的下三角矩阵、为可逆上三角矩阵,表示分解唯一。为对角矩阵,其中式(8)中的对角元素为所有特征值,(11)式中可逆。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步