1. 内积空间
1.1 欧几里得空间
线性空间在添加了双线性的运算后,向量之间建立了简单的正交、非正交的关系。数域是最常见的域,它天生就带着度量的使命,所以在数域的线性空间中,我们不能回避向量间的度量。所谓度量就是用一个数表示向量之间的关系,并衍生出长度、距离和角度的概念,而在度量上最“完备”的数域当然是实数域,故这里的长度先限定在实数域上讨论。但其实本篇的推导和结论其实对数域的要求并不高,如果放在更弱一点的代数数域中(至少包含),是同样可以成立的。
双线性函数正好是用数量来表示向量的关系,在这里我们还需要对其加一些限制条件。首先我们希望这个度量与向量的顺序无关,所以要求双线性函数是对称的。其次我们准备用二次型表示向量长度,所以还要求它是正定的。为此我们定义实数域上正定的对称双线性函数为向量的内积 ,简记为或,易知内积的度量矩阵为正定实对称矩阵。
定义了内积的实线性空间叫实内积空间 ,或者叫欧几里得空间 (Euclid),有了内积下面就继续定义长度和距离(式(1))。由于二次型是二次函数,所以定义向量的长度 时,需要对其开平方,即的长度为,简记为。长度为的向量称为单位向量 ,对任意非零向量显然是单位向量。而距离 自然定义为向量差的长度,记作。你可能注意到,这样定义的内积其实与解析几何中介绍的是有差别的,我们还需要验证这些定义是否符合几何学中的基本关系。
内积作为向量间关系,除了长度之外应该还有角度的性质,比如前面的正交性。考察等式并将其展开,得到不等式。该式成立的充要条件是判别式非负,等号成立的条件是线性相关。整理判别式即有Schwarz-Cauchy不等式 (2),有了这个不等式我们就能方便地定义向量的夹角 了(式(3))。
等式(2)两边同时加上,整理后可以得到三角不等式 (4),它还有等价形式(5),这个式子保证了距离的概念是合理的。 当正交时,(4)式两边取平方即可得勾股定理 (6),并且易证等式(6)是正交的充要条件。式(6)还可以推广到两两正交的有限向量组中,请自行论证。
1.2 酉空间
复数域是实数域的代数闭包,我们希望能把度量的概念推广到复线性空间。但度量首先要求长度、距离这样的概念是非负实数,对称双线性函数不再适用,比如要求都大于就是不可能的。要进行概念的推广,就不得不打破双线性函数的束缚,或者说将其也进行推广。
对推广后的函数我们有三点需要满足:(1)要能兼容实数域上的内积;(2)长度的概念满足正定性;(3)距离概念还满足三角不等式。先来处理简单的场景,考虑的正定性,如果还是定义成,在复数域上并不是正定的。回想到复数共轭的概念,很容易想到将第二个参数变成其共轭,即将定义为,也可以一般性地定义为半线性 (式(7))。
函数在第一个变量上可以继续保持线性函数,为了能体现出函数在实数域上的对称性,式(7)和第一个变量上的线性相结合,便是式(8)的Hermite性 。由此我们便有了复数域上的“内积”定义:(1)是上的线性函数;(2)满足Hermite性;(3)是正定的。这样的函数被称为复内积 ,它显然和实内积兼容,所以也可以简称为内积 ,同样记作或。定义了内积的复线性空间称为复内积空间或内积空间 ,也称为酉空间 (unitary linear space)。
在有限维空间中,选定一组基后,内积也可以由这组基上的度量矩阵 (式(9))决定。度量矩阵显然满足,并且当基通过过渡矩阵转变时,也同样有类似“合同”的关系式(10)。类似于实对称矩阵的可对角化,你也可以验证内积度量矩阵也是可对角化的。
由于内积的正定性,长度 和距离 的概念就自然引出了(式(1)),现在还需要证明三角不等式 (4)(5),它们依赖于Schwarz-Cauchy不等式 (式(2))。在复内积上,式(2)的证明本质和实数域上一样,只是在复数域上形式稍显复杂,其实直接将中轴数带入的展开式便可得到,请自行验证。
由式(2)自然可以定义角度 (式(11)),注意这里的取值范围,它在复线性空间中更合适。定义了角度后,自然地就能引出正交 的概念,以及正交向量的勾股定理 (式(6)),你可以自己完成这些推导。
2. 正交性和正交变换
上面完成了内积空间的定义,并且看到酉空间对欧几里得空间是完全兼容的,今后的讨论都设定在酉空间中。
2.1 正交基
由于内积的度量矩阵可以“合同”对角化,所以内积空间总是存在一组正交基 。我们希望在正交基下继续研究空间结构,但没有度量的帮助这一切都无法实现。而现在有了内积的定义,下面就来着手讨论正交关系下的内积空间结构。先来看看正交向量的性质,设两两正交,如果有,该式分别与求内积得,从而。这就说明了内积空间中,两两正交的向量必然是线性无关的。
从而实内积空间中最多有个正交向量,而且如果有的话它们便是一组基,单位向量组成的正交基又叫标准正交基 。标准正交基使得度量有了单位,从而方便了表达。比如由于标准正交基的度量矩阵是,向量的内积表达式就只与它们的坐标有关(式(12))。进一步地,设是一组标准正交基,则每个向量的坐标也可以直接由内积表示(式(13))。式(13)也叫向量的Fourier展开 ,其中坐标也叫Fourier系数 。
回顾实对称矩阵可合同对角化的证明,整个过程其实就是在寻找正交化基,现在把这个方法整理出来。设是任意一组基,现在来构造一组正交基。构造的过程既要引入向量,又要和已经构造的正交。模仿对角化的过程,先设,然后设。利用正交性可求出的唯一解,这就得到了正交基(式(14)),这个过程也叫Schmidt正交化 。
2.2 酉矩阵(正交矩阵)
以上正交化过程中,如果选取不同的基,也将得到不同标准正交基。这些标准正交基之间有什么样的关系?设两组基的过渡矩阵为,根据两组基的度量矩阵的关系有,为此定义满足的方阵为酉矩阵 ,在实数域上又叫正交矩阵 (满足)。酉矩阵 有着非常好的性质,首先它的逆矩阵正好就是它的共轭转置矩阵 (式(15)),进而可知它的行向量和列向量都是坐标空间中的一组标准正交基。还容易看出,如果是酉矩阵(正交矩阵),则都是酉矩阵(正交矩阵)。两边取行列式,可知酉矩阵的行列式的模为(对正交矩阵则是)。
式(14)可以整理为如(16)的关系式,这个式子表示了两组基的过渡矩阵。考虑到可逆矩阵的行其实就是坐标空间的一组基,因此可以表示为,其中为行向量互相正交的矩阵。将正交化为,系数转移到上得到,于是就有。在的列向量上讨论可以得到类似的结论,总结为式(17),就是说任何可逆方阵可以分解为一个对角为正数的下三角矩阵和一个酉矩阵的乘积,也可以分解为一个酉矩阵和一个对角为正数的上三角矩阵的乘积。容易验证,这样的分解还是唯一的。
2.3 正交投影
由于正定性,内积在任何子空间上都是非退化的,类似上一篇的结论可知。更一般地,设,将任何向量映射到中的分量的线性变换,称为正交投影 ,也称为的正交投影。在几何空间中,正交意味着最短距离 ,这个结论在内积空间中也同样成立。取中的任意向量,由于,通过式(18)的推导便有式(19)成立,当且仅当时等号成立,结论得证。
正交投影的最短距离原理可以用于数据的逼近,也就是说在中对的最佳逼近元 ,现在来看一个应用。比如我们事先知道或假定变量是向量的线性函数,为了确定系数测得了组样本。考虑到测量误差,样本数一般是要大于的,但这样就可能导致方程组(20)可能无解。
不一定能由线性表出,那只好取合适的使得尽量小。利用正交投影的最短距离原理,即要求在上的正交投影。该条件等价于,用矩阵表示就是式(21)。容易论证该方程有解,这个方法就是最小二乘法 ,得到的解也称为最小二乘解 。
2.4 酉变换(正交变换)
线性变换一直是我们研究线性空间结构的重要方法,现在就来看看引入度量的限制后,空间变换又体现出什么特性。其实更一般地,我们不在线性变换的基础上作度量的限制,而是先直接研究度量限制下的映射。为此定义保持内积不变的映射为保距映射 (式(22)),首先保距映射显然保持向量的长度、距离和角度不变,这样的映射很有应用价值。接下来你容易验证式(23)成立,从而保距映射必定是线性映射。
最后使用反证法,容易知道保距映射是单射,对于有限维空间它显然是双射,对无限维空间还需要求映射是满射。有双射保距映射的内积空间称为是保距同构 的,也记作。保距同构的有限维内积线性空间的维数必然相同,反之对维数相同的两个内积线性空间,分别取它们的一组标准正交基作为映射的像和原像。容易验证映射是保距映射,从而有限维内积线性空间保距同构的充要条件是:它们的维数相同。
当保距变换作用于空间自身时,自然就是一种特殊的线性变换,它被称为酉变换 (实数域上又叫正交变换 )。对有限维内积线性空间,线性变换是酉变换的充要条件是:一组标准正交基被变换为另一组标准正交基,即线性变换的矩阵是酉矩阵。酉变换是比可逆线性变换条件更强的变换,保距性使得它更具有使用价值,后面我们会继续讨论酉变换下的空间结构。
由于正交矩阵的行列式为,为此把正交变换分为两类,第一类 的行列式为,也叫旋转 ,这个概念来自于几何空间。第二类 的行列式,设是到某个一维子空间的正交投影,则易证是第二类的,它被称为镜面反射 。其实还容易证明,任何一个第二类的正交变换,都是一个旋转叠加上奇数个镜面反射得来。
对于线性变换,最重要的就是研究它的不变子空间的分割,而酉变换的保距性为我们的研究提供的很好的工具。设是的不变子空间,由于,我们来考察。设,由于是双射,则存在,从而有式(24)的推导。也就是说,所以也是的不变子空间,这样就是的一个不变子空间分割。
设有特征值及其特征向量,由式(25)的推导可知。在复数域中,特征值总是存在的,设,则由刚才的结论知仍然是正交变换。使用归纳法可知有不变子空间分割,其中,而特征值的模都为。这就是说酉变换的度量矩阵相似于一个对角矩阵,特别地,酉矩阵也可以对角化。酉矩阵是酉变换在一组标准正交基下的度量矩阵,对角化后的一组基是正交的且很容易单位化,故酉矩阵的对角化时的过渡矩阵也可以是酉矩阵。换句话说,任何对任何酉矩阵,总存在酉矩阵使得式(26)成立,其中是的所有特征值。
上面的讨论中,我们充分借助了变换在内积上形式特点,讨论了不变子空间的分割,并且借助于正交性,将相似限定在标准正交基上。由于酉矩阵同时充当了相似和合同的过渡矩阵,这还为两类问题找到了一个连接的通道。沿着这个思路,下面将继续使用内积来讨论线性变换,并得到在标准正交基下的不变子空间分割。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架