【高等代数】06 - 线性函数

  在线性代数中,我们花了3篇讲解(双)线性函数的相关结论。这里我想把核心内容再阐述一遍,在忽略一些细节的同时,希望对整体结构有更深刻的理解。需要注意的是,这里双线性函数只是起点,后面的内积、酉变换、正规变换,都在不断地打破和拓展之前的概念,最终还是为了讨论特殊线性变换的标准型。

1. 双线性函数

1.1 双线性函数与正交

  在有了双线性函数的定义后,可知在任意选定的一组基下,双行线函数f可由其度量矩A完全确定。站在矩阵的角度,相关概念也变得更加直观。比如固定左向量α而得到的线性函数αL,可以对应到A的行向量的线性组合(系数为α坐标)。而全体αL组成的线性函数空间WL,则同构于A的行向量生成的线性空间。那些使得αL=0的全体α(双线性函数的左根radLf),则同构于αA=0的解空间。对应右边的向量β,也有定义WR右根radRf。当A满秩时,左右根皆为空,这时称双线性函数是非退化的。

  不同基下的度量矩阵A,B也不相同,并且与两组基的变换矩阵P有关系式B=PAP,这样的矩阵A,B称为合同矩阵。反之,同一组基下度量矩阵合同的变换,可以认为是同构的。为了讨论同构意义下双线性函数空间的结构,我们熟悉的方法是“不变”子空间的分割,为此还要规定式(1)左的正交性。可以证明,满足正交性的双线性函数必然是对称或反对称的,即A=AA=A。而双线性函数空间T2(V)是对称S2(V)和反对称A2(V)双线性函数空间的直和,故而有些讨论可以集中在后两个空间上。

(1)f(α,β)=0f(β,α)=0αβ

  正交性自然地引出了向量或子空间正交补(子空间)α,W的概念。然后根据线性方程组的理论,容易推导W,W维度之间的关系(行列向量维数与解空间的关系)。特别地有,双线性函数的左右根相同,可以记作V=radf。还有如果f在子空间W下非退化,易证WW无交集、且维度之和是n,从而它们是V的正交分割(式(2))。

(2)radf|W=0WW=V

  式(2)可直接用于对称和反对称双线性函数(矩阵)的标准型讨论上。若是对称矩阵,先任选f(α,α)0,根据式(2)先将V分解成αα,然后依此继续分解α,直至剩下一个radf。在选定的基下(根空间任意选),函数的度量矩阵是一个对角矩阵(合同标准型)。再看反对称矩阵,先任选f(α,β)=1,根据式(2)从W=α,β开始正交分解,最终得到[0110]0组成的分块对角矩阵。

  合同矩阵的秩是不变的,对称矩阵和反对称矩阵的秩在标准型上有明显的表现。反对称矩阵的秩一定是偶数,且标准型在任何域上的形式都是最简的。对称矩阵在不同域上还可以进一步讨论,以下先假定它的秩为r。在复数域上,通过调整基的系数,可得到标准型diag{Ir,0nr}。在实数域上则可以得到标准型diag{Ip,Iq,0nr},其中p+q=r。依次记三个子空间为V+,V,V,注意前两者并不唯一,而后者就是根空间。另外不难证明,任何“正”子空间都与VV无交集,这就可以证得:p,q在任何标准型中都是一样的(惯性定律),它们被称为正(负)惯性指数

1.2 内积与酉空间

  实数域(或其子域)有更多实际的场景,把函数限定在实数域上还可以度量线性空间。为了引出长度的概念,还要对函数增加一个限定,即有f(α,α)>0恒成立。这时f只能选择对称函数,且正惯性指数就是n(称为正定的),这样的函数也叫内积,记作αβ。引入内积后的实线性空间也叫欧几里得空间。接下来自然就是定义向量的长度α距离d(α,β)角度(式(3)),以及得到三角不等式勾股定理(式(4,5),这里不再重复讲述。

(3)θ=arccosαβαβ

(4)|αβ|α+βα+β

(5)α2+β2=α+β2

  有时候也需要在复数域空间上定义度量的概念,但双线性函数显然不能满足要求,这时要将实内积的定义进行扩展。首先第一元仍然是线性的,然后交换变量满足式(6)左的Hermite性(可推导出第二元的半线性)。这样的二元函数在选定的基下也有式(6)右的合同矩阵(共轭对称矩阵),同样也能定义正交性以及解析其标准合同矩阵。最后如果加上正定性的要求,这样的二元函数就是复内积,或简称内积。引入内积后的复线性空间也叫酉空间,其上也可以定义长度(模)、距离、角度,以及有三角不等式和勾股定理。

(6)f(β,α)=f(α,β)A=A

  Hermite性可以兼容实空间的线性,且复内积也是兼容实空间的实内积的,进而酉空间其实是阿基米德空间的母空间。所以如果不特别强调,以下我们都在复数域上讨论。另外,在定义了正交的空间中(不限定为内积),如果二元函数是非退化的,则使用Schmidt正交化总可以找到一组正交基。在内积空间中,还可以找到单位向量组成的标准正交基,这时内积空间同构于向量对于基的系数组成的坐标空间,而内积就等于坐标向量的内积(式(7))。

(7)αβ=x1y1+x2y2++xnyn

1.3 正规变换与对角化

  在内积限制下的线性变换(映射)比较常见,这里有必要讨论一下它的标准型。首先限定变换下向量间的距离是不变的(保距变换),不难证明它是一个双射的线性变换,而且等价于:将一组标准正交基变换为另一组标准正交基。也就是说变换矩阵满足PP=I,这样的矩阵叫酉矩阵(实数域下叫正交矩阵),这样的变换则叫酉变换(实数域叫正交变换)。酉矩阵是名副其实的“单位矩阵”,它的行列式的模为1(利用特征式),所有特征值的模也为1(利用单位向量的变换),所有行(列)向量是正交的单位向量。

  当我们讨论酉变换A(酉矩阵)的标准型时,其实并不一定有内积空间的定义,但如果补齐这部分定义,就能利用其独有的结构特点。正交性可以使空间分割变得非常方便,结合线性变换需要的A-子空间,容易想到去寻找一组正交的特征向量。先随意找到一个特征向量η,并生成A-子空间W,容易证得V=WW。接下来利用双射性可知W也是A-子空间(式(8),这一步不可缺少),从而可以在W中继续寻找特征向量,最终得到式(9)的标准型。由于寻找的特征向量是正交的,PP一定是一个对角矩阵,如果把特征向量单位化,P也可以是酉矩阵。

(8)αAβ=AαAβ=αβ=0

(9)PAP1=diag{λ1,λ2,,λn}

  任意变换矩阵A都定义在某组基下,如果将这组基定义为标准正交基,该定义便可扩展成整个域上的内积空间。刚才我们看到了正交在对角化中的作用,现在来继续榨取这个工具的威力,把对角化的范围尽量扩大。值得提醒的是,这里的讨论需借助内积的概念,因此线性空间被限定在数域上,对角化也只讨论正交对角化。现在回顾上面的讨论,最关键的一个条件是:如果WA-子空间,则W也是A-子空间。为此就要有αAβ=αβ,其中α,αW;βW。如果不限定向量的范围,等式中的α总是有解的,记A:αα,不难证明它是线性变换,且满足A=A,它也称为A伴随变换

  伴随变换的矩阵关系A=A,使得它的定义可以更加自由灵活,比如教材上一般定义为Aαβ=αAβ。这里还会发现一个简单事实,如果WA-子空间,那么W就是A-子空间。想要从特征空间W=η开始构造对角化,就要证明WA-子空间,这也等价于WA-子空间。不过在此之前,我们先从A可正交对角化出发,看看变换还有什么必要条件。记正交对角化A=PDP1,则有A=PD¯P1,这时AA=AA。 反之,可交换性使得A,A能像标量一样在表达式里“自由穿梭”,比如容易有Aα=Aα,更一般的还有f(A)α=f(A)α

  特别地,则有我们需要的(AλI)α=(AλI)α=0,即WA-子空间。综合这两段的讨论便有,数域上的线性变换A可正交对角化的充要条件是:An个特征值且AA=AA(或式(10)的等价条件),满足式(10)的变换也称为正规变换。然后就可以构造一些常见的正规变换,比如上面讨论的酉变换,再比如复数域上的共轭对称变换A=A,也被称为Hermite变换,实数域上就是熟知的对称变换。酉变换和Hermite变换天然有n个特征值,而注意到Hermite变换的特征值都是实数,所以对称变换也有n个特征值(放到复数域看),它们都可以正交对角化。

(10)AA=AAAα=Aα

2. 多重线性函数

(暂且搁置)

  

posted on   卞爱华  阅读(1496)  评论(0编辑  收藏  举报

编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2017-05-22 【数理统计基础】 05 - 回归分析
2017-05-22 【数理统计基础】 04 - 假设检验
2017-05-22 【数理统计基础】 03 - 参数估计
2017-05-22 【数理统计基础】 02 - 统计量和三大分布
2017-05-22 【数理统计基础】 01 - 关于预测的方法学

导航

点击右上角即可分享
微信分享提示