1. 矩阵和秩
1.1 矩阵的定义
前面我们在不定义的情况下,一直在使用着矩阵,那些场合中矩阵仅仅是一些数的纵横排列,它只有符号的意义,而没有代数的性质。在继续讨论之前,先严格定义一下阶矩阵(matrix):它由个环元素排成行列(式(1)),并用方括号括起来,一般用大写字母表示,阶矩阵又称阶方阵。矩阵元素的取值空间可以为一般环,也可以是域,这里默认是在域中讨论,环矩阵以后专门介绍。
矩阵既可以看成是一个纵横排列的结构,也可以把它当成是由个孤立的元素组成。这时矩阵就是一个维的向量,按如下方法定义加法和数乘运算,显然所有阶矩阵组成一个维的线性空间,一般记作,方阵也可记作。
方阵中称为主对角元,仅主对角元非零的矩阵称为对角矩阵,记作,其中也叫单位矩阵,记作。主对角线下(上)方全为的矩阵称为上(下)三角矩阵,单位矩阵经过一次初等变换后称为初等矩阵(式子(4))。元素全为的矩阵一般记作,容易有等式,这个式子变形中非常有用。
矩阵中一个常用操作就是将和交换,得到的新矩阵叫的转置,一般记做或。显然有等式(3)成立,这个等式一定程度说明了矩阵中行和列的对等性。的矩阵称为对称矩阵,的矩阵称为反对称矩阵,显然反对称矩阵的对角元皆为。
• 求阶对角矩阵、三角矩阵、对称矩阵、反对称矩阵的维度;
• 求证:奇数阶反对称矩阵的行列式为。
1.2 矩阵的秩
解线性方程组时,系数矩阵可以看成是个列向量,这个向量组有它的相关性和秩。这使得我们好奇:矩阵行向量的相关性和秩是怎样的?它与列向量有什么关系?
不管是在线性方程组还是行列式中,我们看到用初等变换将矩阵阶梯化可以简化问题。容易证明,初等变换并不改变向量组所生成的线性空间,故它们的秩是不变的。所以矩阵的行(列)向量在阶梯化后秩保持不变,而显然阶梯矩阵的秩就是非零行(列)的个数,这就是求秩的一般方法。在按行阶梯化矩阵后,可以很轻松地继续按列阶梯化(公式(4)),最终每行每列最多只有一个非零元素。这样的话,矩阵行向量和列向量的秩都等于非零元素的个数,它们是相等的。我们把这个共同的秩也称为矩阵的秩,同样记作,秩是矩阵的一个基本属性。
在秩为的向量组中,我们可以选出个无关向量作为它的代表,那么在秩为的矩阵中是否有的“子矩阵”呢?为此先定义矩阵任意行、列的交点元素组成的矩阵为其子矩阵,这是除行、列外考察矩阵的另一个视角。由于线性相关向量组的子向量组或截断向量组也线性相关,故子矩阵的秩必定不大于。另一方面,可以先选出行无关的行向量,它们组成的矩阵的秩还是,所以一定有列是线性无关的,这就找到了原矩阵秩为的子矩阵。特别地,满足的矩阵称为满秩矩阵,对应分别有行满秩和列满秩的概念。
我们现在有三个视角看待一个矩阵:行或列的向量空间、矩阵的秩、方阵的行列式,这里稍作总结。首先矩阵的秩也是向量空间的维数,所以线性方程组有解的充要条件是:系数矩阵的秩等于增广矩阵的秩,有唯一解时还要求系数矩阵是列满秩的。特别地,齐次方程有非零解的充要条件是:系数矩阵不是列满秩的,且解空间满足公式(5)。对于方阵而言,它满秩的充要条件是:矩阵的行列式非零。
2. 矩阵的乘法
2.1 定义和基本性质
线性空间的浅层结构我们已经基本了解了,按照抽象代数的经验,现在需要借助同态映射研究其深层结构。但在此之前,我们需要需要一点准备工作,而把同态映射放到下一篇中介绍。其实前面的线性方程组就是同态映射的一个具体例子,现在就以此为切入点介绍矩阵的乘法。
回顾上一篇的线性方程组(11),如果把未知数也看作是一个向量,系数矩阵可以看成是将映射成了。映射是可以复合的,但要继续映射,矩阵的列数必须是,设为。设将又映射成,可以算得,其中。复合映射的结果任然可以看成是一个矩阵在上的映射,为此我们定义这种映射的复合为矩阵的乘法,记作,其中的元素满足下式。
对矩阵,可以证明有式子(9)成立,所以矩阵的乘法满足结合律。但不是所有矩阵之间都可以做乘法,所以全体矩阵并不构成半群。要使乘法处处成立,必须是阶相同的方阵组成的集合,但即使是方阵的乘法也不一定满足交换律。另外容易验证,乘法和加法的分配率成立(式子(10)),数乘运算满足公式(11),转置运算满足公式(12)。
如果集合中任意两个矩阵都可以做乘法,这个集合必定是由阶相同的方阵组成的。特别地,是一个幺半群,其中单位元就是单位矩阵(公式(13))。中的元素可以按照式子(14)定义幂次,容易证明幂次的一般性质对它都成立。另外要注意,由于交换律不一定成立,故一般也不成立。
• 求证:阶对角矩阵、上(下)三角矩阵分别都是幺半群,并且乘积的对角元就是对角元的乘积。
2.2 乘法的向量意义
如果把线性方程组的未知数写成的矩阵,显然方程组其实就是矩阵乘法。另外又因为线性方程组的本质是线性表示,这就将矩阵乘法和线性表示建立起了联系。这个结论一方面给予了矩阵乘法的另一个现实意义,另一方面可以把变换统一到矩阵乘法中去,下面分别加以阐述。
如果把矩阵分别表示成列向量组和行向量组,则可以看成是或的一组线性表示(公式(15)(16)),其中是的列向量组表示,而是的行向量组表示。
这种视角在一些论证中非常有用,比如因为是的线性表示,故的列秩不大于的的列秩,同样可证的行秩不大于的的行秩。结合前面行列秩相等的结论,可有以下秩的估算式。
• 为实数域上的矩阵,求证:方程组和的解空间相同,从而;
• 若,求证:;
• 设的秩为,求证:存在列数为的列满矩阵和行数为的行满矩阵,使得。
其实不光线性方程组可以表示成矩阵的乘积,矩阵上的其它操作也可以转化为乘积,比如数乘运算其实就是对角矩阵与的乘积。另外容易证明,初等矩阵左(右)乘就是将的第行(列)乘以,左(右)乘就是将的第行(列)交换。左乘就是将的第行的倍加到第行上,右乘就是将的第列的倍加到第行上。
2.3 矩阵的逆
是幺半群,并不是所有矩阵都有逆元,这里就来讨论一下矩阵存在逆元的条件,以及逆元的计算。首先如果式(18)成立,就称为的逆矩阵(inverse matrix),也记作。在抽象代数中我们已经知道,逆元是唯一的,且逆元的逆元还是逆元,故唯一且,还有公式(19)成立。
由公式(17)知必须是满秩的,反之对任意满足的矩阵,是否都有逆呢?逆矩阵是可以构造出来的,回顾行列式中的代数余子式的概念,以及行列式按一行(列)展开的结论,我们构造如下矩阵(注意行列的下标),它被称为的伴随矩阵(companion matrix)。
现在来计算,它的第行、列的元素为,它正是将的第行替换成第行后的值。显然时值为,时值为,故,这样就构造了的如下逆矩阵。同时还说明了,矩阵有逆的充要条件是:。
对于线性方程组,它有唯一解的充要条件是,且这个解就是。再根据公式(21),可以得到解的如下公式,其中是将的第列换成后的值。这个式子用系数和常数项表达了方程组的解,该结论就是线性方程组的克莱姆法则(Cramer)。
用公式(21)求逆计算量较大,现在用另一个方法来计算它。首先直接由逆的定义容易证明,初等矩阵都是可逆矩阵,而且它们的逆还是初等矩阵(公式(23))。试想对可逆矩阵进行初等变换,最终一定可以变换成,将这些初等变换表示成矩阵,则有,所以可以表示成初等矩阵的乘积(公式(24))。由于初等变换不改变矩阵的秩,所以与相乘也不改变矩阵的秩(25),这是对公式(17)的一个补充。
公式(24)的左式说明正好就是,所以我们可以对矩阵的行做初等变换,直至将变成,这时原来的自然已经变成了。这样求矩阵逆的方法也叫初等变换法。根据行列式的初等变换可知,初等矩阵对行列式的影响如公式(26),结合公式(24)知可逆矩阵的行列式仅由其初等矩阵决定,从而有可逆矩阵乘积的行列式等同于行列式的乘积(公式(27))。若有非满秩矩阵,公式(27)显然也成立(两边为),故公式(27)对任意方阵恒成立,它就是比奈-柯西定理(Binet-Cauchy)。
对于很多特殊形式的矩阵,有时候直接用逆的定义反而更容易,这当然还需要一些技巧。比如对于常用的矩阵,由于,可以猜想它的逆有形式,解方程便可得到结果。
• 已知,求;
• 若可逆,求证:也可逆。(提示:构造)
2.4 矩阵的分块
把矩阵的行、列连续地分割成行、列,形成一个的分块矩阵,之前将矩阵作为行列向量看待其实就是一种分块方法。分块矩阵其实是扩展了矩阵的元素,但矩阵的很多性质在分块矩阵上同样成立,由此它还成为了矩阵研究的一个有力工具(将矩阵嵌入到分块矩阵中)。
这里先罗列一些分块矩阵的常规性质,首先比较容易得到分块矩阵的转置、乘法的形式结果,也容易定义分块对角矩阵、分块上(下)三角矩阵,这里就不赘述了。同样可以对分块矩阵进行初等变换,行变换对应的初等矩阵如公式(28)所示(交换较复杂),初等变换都是满秩的(),它们不改变分块矩阵的秩。
分块矩阵的初等变换能方便地找到矩阵间的关系,当要讨论矩阵性质时,可以先把它们嵌入到分块矩阵中,通过初等变换得到一些表达式。比如刚才的习题中,要研究和,可以先把对应矩阵放到公式(29)左边的分块矩阵的行列式中,分别作和两种行变换,由行列式不变得到右边的结论。
再比如考察,将它嵌入到公式(30)左边的分块矩阵,依次使用行变换、列变换,得到右边的分块矩阵。这样就有,故得到公式(31),这个结论叫Sylvester秩不等式,它和公式(17)一起组成了秩的估算式。
• 求证:的充要条件是:;
• 使用分块矩阵证明公式(27);
• 都是方阵,可逆,求证:。
最后,我们使用分块矩阵讨论一下矩阵的“逆矩阵”。我们知道,若方程组有解,解的表达式为(注意可能不唯一)。这个是的“逆矩阵”的理想定义,记之为,但我们需要用单纯的矩阵语言描述它。首先有,另外固定时,这个式子成立的充要条件是:为的列向量的线性组合。所以该等式等价于等式(32),我们也就把所有满足式子(32)的称为的广义逆矩阵。
剩下的问题是如何表达广义逆,首先容易知道,秩为矩阵在经过一系列行和列的初等变换后,总能得到形式,故存在可逆矩阵使得公式(33)左成立。带入公式(32)有,即,所以,其中任意,这样就得到了广义逆的表达式(33)右。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 智能桌面机器人:用.NET IoT库控制舵机并多方法播放表情
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 手把手教你在本地部署DeepSeek R1,搭建web-ui ,建议收藏!
· 新年开篇:在本地部署DeepSeek大模型实现联网增强的AI应用
· Janus Pro:DeepSeek 开源革新,多模态 AI 的未来
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(三):用.NET IoT库
· 【非技术】说说2024年我都干了些啥