矩阵本质的意义在于线性变换,可以说离开线性变换,矩阵是毫无用处的。而线性变换的基本运算就是加法和乘法,其中对矩阵乘法的研究一直是线性代数中的核心内容。其中包括矩阵的幂次方、矩阵的逆、矩阵的分解,而且它们是互相渗透的。虽然说研究矩阵乘法的目的是线性变换,但乘法本身的性质可以脱离线性变换而讨论,我们将再花两篇的空间来展开阐述。
1. 矩阵的逆
1.1 矩阵的计算
一般矩阵的乘法是不可交换的(),但在一些特殊情况可以满足交换律,适当地使用交换性将得到很多漂亮的结论。一个典型的代表就是同一个矩阵的幂次之间是可交换的,这使得对任何多项式,可以自由使用。这包含两层意思,一个是不管写成什么样的因式形式,都是相同的;另一个意思是对任何多项式都有,这使得一些复杂表达式的处理更加自由。
另外,证明矩阵可逆和求矩阵的逆,一般使用定义(行列式非零和代数余子式)以及初等变换法。对于一些特殊矩阵,其实可以直接拼凑出的形式,这样就得到。在本篇特殊矩阵部分,我们还会碰到这样的例子,这里先举一些普通的例子。比如已知,则有,两边减去整理得,从而互为逆矩阵。随之还能得到,展开后有,从而还能得到。
另外前面已经证明,那么如果已经知道,如何来求呢?基本思路其实就是拼凑,首先由于,为了凑出,现在两边同时乘上,整理后得到。两边同时乘上并用来减,整理后得到,所以有式(1)成立。
1.2 广义逆矩阵
以前我们简单介绍过广义逆矩阵,这里再稍微细致地讨论一下。在一般矩阵方程中,如果可逆,则完全确定且可以简单地表示出来。但不可逆时,现在却没有较好的工具描述有解的充要条件,并给出解的一般形式。这时我们希望能有类似的逆的概念,或者说矩阵的逆进行扩展,下面从方程的解中寻找广义逆的形式特点。
如果的秩为,则存在可逆矩阵使得,带入方程可以得到。把分块写成,方程有解的必要条件是,且这时方程等价于,其中任意。不难看出,其实可以表示为,其中任意,而要能取遍所有。由可知可以任意取,这就得到了式(2)方程的通解,其中任意。
可以看出把式(3)做为的“逆矩阵”是合理的,它被称为的广义逆矩阵,记作。虽然没有一般逆矩阵的所有性质,但也有个别性质和逆矩阵很像,比如这里的方程解。再比如有等式,其实如果有,利用,不难推到,故有式(4)的等价定义。
现在我们回到方程,还有一个问题没有解决,就是只用来描述方程有解的充要条件。首先方程有解时,,反之当时,方程显然有解。故方程有解的充要条件是。以上通解形式只是理论结果,在使用过程中很不方便,我们需要寻找别的表示方法。当得到一个特解后(取一特定值),只需求解其次方程。首先不难构造出解,其次对于如何解都有,从而是的通解,最终便有了的通解式(5),其中为任意维向量。
广义逆矩阵可以运用在更多的矩阵方程中,构造法往往是求得通解的方法,教材上有具体的例子。现在来看一个判断广义逆的秩方法,使用的是式(6)的秩关系式,先用Sylvester秩不等式得到,再由变换可以得到。等价于,而由式(6)就知道这等价于式(7)右,它便是我们要说的秩判别法。
1.3 Moose-Penrose广义逆
广义逆矩阵可能不唯一,而且也没有很多简单的性质,甚至连基本的对称性都不满足。那么在众多广义逆矩阵里,有没有更加独特的哪一个呢?既然有,至少还应该有吧,乘积虽然不是单位矩阵,但至少是对称的吧。满足式(8)右的矩阵便称为Moose-Penrose广义逆,记作。先来看是否存在,当时,容易知道有唯一解。当时,设,其中分别列、行满秩。可以验证式(9)右满足条件,并且讨论式(10)还能论证唯一性。
自然由对称性可知,但却不能如愿地得到。还需要添加一些条件,比如令分别为列、行满秩矩阵,则有。由式(9)知,然后就容易验证得到式(11)。
2. 线性变换
2.1 相似变换
我们知道,一个线性变换等价于一类矩阵,这类矩阵称为相似的,并且它们之间有相似变换。为了找到线性变换的根本特性,就需要找到这类矩阵的相似不变量,用尽量少而简单的特征来区分和刻画不同的线性变换。这个问题在复空间上得到完满解决,Jordan标准型给出了独一无二的刻画方法。在其它数域上,标准型经常无法给出,我们转而研究可对角化的线性变换,它们有着更加实用的形式。
相似变换的不变量有很多,其中有个不显眼但却很有趣的量,就是矩阵对角线之和,它也称为方阵的迹。迹有个很重要的结论,就是式(12)左的交换乘积顺序不变性,并由此能轻松推到式(12)右的相似不变性。这个特点在有些场合有助于判断矩阵的性质,比如如果,则可以判断不可逆,否则就有,而两边的迹显然不相等。
2.2 特征值和特征多项式
当然,相似变换的最重要的不变量还是特征值(或特征多项式),它们也是矩阵对角化的主角,特征多项式是指行列式。利用行列式的性质,可以将它按行(或列)拆成个行列式之和,其中每个行列式的第行取自或。从而每个行列式都是单项式,其中等同于行列式取自的行的个数,则是剩下的主子式。这就是说特征多项式的系数就是所有阶主子式之和,特别地,的系数是,常数项则是。
由于方阵是否可逆等价于是否为,这就说明了方阵可逆的充要条件是它没有特征值。而对可逆矩阵,由可知,从而可逆矩阵与它的逆有相同的特征向量,且对应的特征值为其倒数。还有一个浅显的结论是,如果是的特征值,则显然是的特征值,而是的特征值。
反过来还可以证明,便是的所有特征值。为此先设的个特征值为(包括重根),再设任意次首多项式的个根为(包括重根),不难得到式(13)的推导。从而直接有,所以的所有特征值就是,结论得证。
当然也不是所有特征值都是要解特征多项式,对于一些特殊矩阵,充分利用它的特点,也可以很快计算出特征值,这里仅举两例。正交矩阵是指满足的方阵,从而有以及,也就是说它的每行(列)的范数为且互相正交。假设,考察,首先有,还可以有,从而得到。另外容易有,而所有特征值的积为,故当时它必有特征值,当且阶为奇数时必有特征值。
再来看一下特征值的关系,由等式不难推导出式(14)。这就是说完全相同的特征值和重数(除外),且特征值的重数相差,当为方阵时它们有相同的特征值和重数。另外如果是的特征向量,则有,两边乘上有,从而是同一特征值下的特征向量。
最后我们来一个简单的特征值的估算方法,先假设,其中。假设的最大值为,则考察的第个元素,整理后不难有估计式(15)。对于的每一行(列),式(15)的取值范围也被称为Gersgorin圆盘,从而任何特征值一定在某个圆盘中。有时把的复特征值集合称为的谱,而特征值模的最大值称为谱半径,利用公式(15)容易得到式(16)。
2.3 对角化和实对称矩阵
再来回到相似对角化上来,我们知道矩阵可相似对角化的充要条件是:所有特征向量空间的秩和为。这个判断方法使用起来比较麻烦,倒是很多充分条件判断起来更容易且更实用,比如特征值互不相同,再比如实对称矩阵等。可对角化的矩阵对于计算非常有利,尤其是计算矩阵的幂,可以直接得到结果。
• 求证:(1)如果,则;(2)如果可对角化,则也可以对角化,并求对角元。
实对称矩阵是很常见的一种矩阵,它在线性代数中也占据了十分重要的地位,它的最大特点就是可以正交对角化(以下来证明)。设是实对称矩阵的特征值、特征向量,则易知也是的特征值、特征向量。由于,从两个角度考察,分别得到,从而得到,得到是实数。从而实对称矩阵的(复)特征值、特征向量都是实数,任何实对称矩阵都至少有一个特征值和特征向量。
• 求证:反对称实矩阵的特征值为纯虚数。
将特征向量扩展为一组正交基并组成正交矩阵,不难证明具有形式,且还是实对称矩阵。利用归纳法容易证明,存在正交矩阵使得,其中。这就是说,实对称矩阵(正交)相似于对角矩阵,且不难证明所有特征值是实对称矩阵的完全不变量。结论在另一方面还说明,实对称矩阵不同特征值的特征向量相互正交。这个结论其实也可以直接证明。比如从两个角度考察,分别得到,从而时必然有。
实对称矩阵的正交可对角化是个非常重要的结论,后面的二次型中还会讨论到,这里先举个典型的例子。同样设,考察,并记,则容易有式(17)的推导(其中分别是的最小和最大特征值)。这样就得到了式(18)左的估计式,特别地取为第位为、其它位为的向量,还能得到式(18)右的估计式。
最后来看一个有趣的应用,Fibonacci数列大家都不陌生,它的递推式为。如果记,则递推式可以写成,其中。求得的特征值后便可以有对角化分解,其中。另外由递推式可知,这样就能得到的通项公式。
3. 特殊矩阵
具有特殊形式或性质的矩阵,在矩阵运算中和分析中具有很重要的作用。当然特殊矩阵的概念很宽泛,包括可逆矩阵、三角矩阵、对角矩阵、对称矩阵、正交矩阵等都可以称为特殊矩阵。这里先列举几个与本篇内容相关的特殊矩阵,一是为了综合运用上面的知识,二是这些矩阵的确有自己的独特性质。下一篇中的矩阵分解中,我们将继续讨论特殊矩阵的特点和应用。
3.1 幂零矩阵
如果存在正整数使得,这样的方阵称为幂零矩阵,它的典型代表就是式(19)左的对角线为的上三角矩阵,只有右上角的条次对角线非零,并且。其中更特殊的就是式(19)右的矩阵,它只有上次对角线全为的(其它为),易知只有第条上次对角线全为(其它为)。
利用式(20)我们就容易知道,和都是可逆矩阵,且互相为对方的逆矩阵。这就为求一类矩阵的逆提供了快捷的结论,而时的结论比较常用。这种方法同样适用于全矩阵,它是一个所有元素都为的方阵,它的典型特点是。利用利用这个等式和方程思想,便可以计算一些矩阵的逆。比如要求的逆,可以直接假设,然后解得。
3.2 幂等矩阵
幂等矩阵就是满足的方阵,由定义显然有,从这个平淡无奇的式子里能得到什么呢?令,由对称性知也是幂等矩阵,且。首先由知,另外还有,从而得到。反之如果且,由Sylvester秩不等式便有,从而得到都是幂等矩阵。
这个结论其实可以得到很好的扩展,更一般地,设方阵满足。以下看三个条件:(I)都为幂等矩阵,且时有;(II)为幂等矩阵;(III)。其中条件(II)等价于(II'),下面来寻找条件(I)的等价条件。令,再令是个组成的分块矩阵,则不难发现条件(I)等价于是说:是的广义逆。
利用公式(7)知它等价于,对进行初等变换可以得到,从而有。注意到,这时(I)的等价条件变为(I')。现在看条件(I')(II')(III),其中任意两者都可以推导出第三者,这个结论对条件(I)(II)(III)当然也是成立的。
另外对于特征值和特征向量,由于得到,从而只有特征值。特征值的特征空间就是的解空间,它的秩为,其中为的秩。特征值的特征空间是的解空间,由于的秩为,故解空间的秩为。这样两个特征空间的秩和为,故幂等矩阵能相似对角化,且对角矩阵为。由于迹的不变性,反之能得到任何幂等矩阵的秩为,这非常便于计算。比如以上条件(II)如果加上“都是幂等的”,则直接得到条件(III),从而可知条件(I)成立。
上段的讨论还说明,幂等矩阵本质上就是特征值1的特征空间上的投影变换。设幂等矩阵本质上分别是投影变换,如果还有条件,用反正法可知交集为空,从而他们线性无关。这样不仅有,还有也是幂等变换,而且是在上的投影。
3.3 位移矩阵
位移矩阵是指矩阵,当它左乘矩阵时,相当于把循环上移一行,当它右乘矩阵时,相当于循环右移一列。是一个特殊的正交矩阵,它的逆显然是,的作用与恰好相反。容易算得的特征多项式为,故它的特征值是所有单位复数,由的循环特性不难构造出的特征向量。这样就有,其中,且。
第一篇中我们碰到过循环矩阵,观察的形式特点,不难得到式(21)。从而的个特征值为,且和有相同的特征向量,这样就可以把写成,其中。这样就不难算得,和前一篇的结论是一样的,但思路却更加自然。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· DeepSeek 解答了困扰我五年的技术问题。时代确实变了!
· 本地部署DeepSeek后,没有好看的交互界面怎么行!
· 趁着过年的时候手搓了一个低代码框架
· 推荐一个DeepSeek 大模型的免费 API 项目!兼容OpenAI接口!