【线性代数】 02 - 线性空间

  大部分教材一开始便会讨论行列式和矩阵,这当然是从实用的角度编排的。我们这里则更关注学科的完整性和概念的连贯性,从线性代数的基础研究对象讨论起。在抽象代数中我们已经意识到,代数学其实就是一门关系结构学,不同的学科差别只是所研究的具体结构不同而已。

1. 线性空间

1.1 向量和线性空间

  线性代数讨论的对象是向量,大家熟悉的空间(平面)中向量的概念是:一条有方向的线段。空间向量只关心方向和长度,它的起始、结束点并不重要。解析几何中规定了原点和坐标,将一个向量平移,使其起始点和原点重合,那么结束点的坐标(x,y,z)就用来表示这个向量。这里务必要区分开坐标和向量的差别,坐标仅表示一个点,而向量是有向线段,但坐标可以唯一表示某个向量。

  空间(平面)的向量一般叫三维(二维)向量,受坐标表示式的启发,容易将向量的概念扩展到更高维中(甚至可数无限维):(x1,x2,,xn)。但在数学上,仅做这样的简单扩展还是不够的,因为它还不是一个代数结构。那什么样叫代数结构?简单说就是一个集合,它在一些运算下封闭,并且满足一定的运算律。现在就从向量的直观性质出发,看看用代数语言如何给其下定义。

  首先我们讨论的是一个集合V,它的元素在加法下构成一个交换群(结合律、单位元、相反数、可交换)。另外有一个域K(加法交换群、乘法交换群、分配率),它与V有运算K×VV。这个运算满足式(1)的条件(k,lK,α,βV),其中第二个条件可以把域的乘法当做映射的复合,最后两个条件就是分配率。满足这些条件的集合V称为是K上的向量空间线性空间(linear lpace),其中的元素就叫向量(vector)。

(1)1α=α;(kl)α=k(lα);(k+l)α=kα+lα;k(α+β)=kα+kβ

  要注意V中的加法和K中的加法是不同的,K中的乘法和K×V中的乘法也是不同的,并且V的零元和K的零元也不同,但一般它们不会产生混淆,故使用相同的记法。这个向量定义并不受维度限制,它的范围比坐标形式更加广泛。反之容易看出,坐标向量在特定维度和数域下形成一个线性空间。今后坐标向量我们用以下矩阵形式表示,它们分别也叫行向量列向量

(2)[a1a2an][a1a2an]

  对于两个线性空间V1,V2,如果它们之间存在一一映射σ,满足式子(3)中的条件,则称这两个线性空间同构。同构的线性空间的结构是一模一样的,可以等价对待。

(3)σ(α+β)=σ(α)+σ(β);σ(kα)=kσ(α)

   求证:kα=0的充要条件是k=0α=0

   求证:任何域都是其子域上的线性空间。

  与任何一个代数结构一样,我们现在需要定义线性子空间。由于线性空间的讨论对象是V,所以不必要在K上作限制,而是讨论V的一个子集VV要想成为线性空间,其实只要保证V的加法以及数乘封闭(公式(4)),其它运算律是自然成立的,满足这样条件的子集V就叫V线性子空间。容易证明,线性子空间的交V1V2也是线性子空间。

(4)α+βV,kαV(kK,α,βV)

  线性空间的某个向量组{α1,α2,,αn},让它们进行任意的乘法和加法运算,根据运算律总可以化简为(5)的形式,这也正是“线性”的表现。容易证明(5)式所有元素组成的集合是一个线性子空间,它被称为{α1,α2,αn}的生成子空间,记作L(α1,α2,,αn)α1,α2,,αn。显然生成子空间是包含向量组的最小线性子空间。

(5)β=k1α1+k2α2++knαn

2.2 线性相关

  由以上讨论我们知道,向量之间的关系只能以式子(4)的形式体现,想要进一步分析线性空间的结构,也就必须分析清楚这样的关系。首先式子(5)叫做α1,α2,,αn的一个线性组合,这样的β称为可以被α1,α2,,αn线性表出。这个概念还有一个更简洁的等价说法,如果(6)式成立时存在ki0,则称α1,α2,,αn线性相关,否则称为线性无关。显然线性相关的等价条件是:存在αi,它可由其它元素线性表出。对含有无限个元素的向量组,它们线性无关可以定义为:不存在线性相关的有限子集。

(6)k1α1+k2α2++knαn=0

   α1,α2,,αn线性无关,式(5)中如果ki0,则将αi替换为β后,向量组仍然线性无关。

  两个向量组如果可以互相线性表出,就称它们是等价向量组。一个线性相关的向量组(线性空间)总是等价于它的一个真子集,对于那些找不到等价有限真子集的向量组(线性空间),对它的讨论也就到此为止了,以下总假设向量组(线性空间)等价于它的有限真子集(其实对于无限的场景,利用Zorn引理也可证得极大无关组的存在性)。向量组中的每个元素都可以由这个真子集线性表出,容易证明线性表出的方法(系数ki)唯一的充要条件是:这个真子集是线性无关的,这样的子集就叫向量组的极大线性无关组

  选定一个极大线性无关组后,向量组的每个元素都可以由它们唯一线性表出,特别地,线性空间由它的一个极大线性无关组完全确定。这时我们自然有一个问题:不同的极大线性无关组之间有什么关系?它们的个数相同吗?在选定极大线性无关组α1,α2,,αn后,任意选取无关组β1,β2,,βm,且假设βj=aijαi。由于{βj}线性无关,则方程βjxj=0仅有零解,将其展开为{αi}的线性组合,并由{αi}的无关性知方程组(7)成立。

(7){a11x1+a12x2++a1mxm=0a21x1+a22x2++a2mxm=0an1x1+an2x2++anmxm=0

  可以使用消元法解方程组(7)(详细见下节),由于它没有非零解,所以必须有mn,这就是说线性无关组的元素个数都不大于n。所以向量组如果有不同的极大线性无关组,它们元素的个数一定相等,这个数是向量组的恒定值,称为向量组的,记作rankS,在线性空间中这个值也叫空间的维度,记作dimV。秩和维度是向量组(线性空间)的基本特征,任何元素都可以按照(5)式得到唯一的坐标形式(k1,k2,,kn)。特别地,在线性空间中,极大线性无关组又叫线性空间的,而且容易证明,n维线性空间其实和n维坐标向量空间是同构的,我以后可以直接用坐标向量来表示一般向量。

   求证:等价向量组的秩相等。

2.3 直和

  现在继续研究线性空间的结构,有过抽象代数的经验,我们知道接下来要考虑空间在两个维度的分解,一个是直和分解,另一个是商群分解。本节只讨论直和分解,首先容易证明线性子空间的和V1+V2也是线性子空间,而且它是包含V1V2的最小子空间。我们来看看它的维度是多少,首先取V1V2的一组基A,将它分别扩展为V1,V2的基AB1,AB2。容易证明A,B1,B2线性无关,故AB1B2就是V1+V2的一组基,从而有公式(8)成立。

(8)dim(V1+V2)=dimV1+dimV2dim(V1V2)

  V1+V2中任何一个元素都可以分解为α=α1+α2,(αiVi),如果V1V20,容易构造出α的不同分解。反之如果V1V2=0,用反证法可知分解是唯一的。这时的V1+V2称为子空间的直和,记作V1V2。类似于抽象代数中的结论,直和的定义等价于零元素的唯一分解。这里的结论很容易推广到多个子空间的直和,且它有公式(9)中的等价定义。直和将线性空间分解为几个无关的子空间(式(10)),它其实是基的概念的一个扩展,特别地,n维线性空间可以分解为n个子空间αi的直和。

(9)V1V2VmViijVj=00=αiαi=0

(10)dim(V1+V2++Vm)=dimV1+dimV2++dimVm

  子空间的并V1V2虽然有“加法”的外表,但在代数结构中却不具有加法的性质,一个典型的结果就是:有限个任意真子空间的并都不等于父空间(式(11))。V1V2的场景比较好证明,当一个是另一子集时结论显然成立,不是时则可以取αV1,βV2,但αV2,βV1,容易证明α+βVi。然后用归纳法证明,先记V0=V1Vs1,当V0,Vs中一个是另一个子集时结论显然成立,不是时可以取取αV0,βVs,但αVs,βV0

(11)V1V2VsV,(ViV)

  类似地可以证明α+βVs,但却不能用这种方法证明α+βV0,因为V0不一定是子空间。为此考虑所有向量ηk=α+kβ,同样有ηkVs,还需证存在ηkV0。对任意m<s,假设有ηi,ηjVm,则ηiηj=(ij)βVm,从而i=j。这就是说Vm中最多只有一个ηk,如果再假设V的域F是无限的,则一定能找到ηkV0,结论得证。

2. 线性方程组

  前面我们从线性组合出发,从理论上分析了线性空间的结构,但还有一个很实际的问题没有解决:如何将一个向量表示成给定向量组的线性组合?或者如何判定向量组的线性相关性?我们只讨论有限维线性空间的情况,而它是等价于一个n维坐标向量空间的。设向量组为α1,α2,,αm,用它们的线性组合表示β就是解如下左边的方程,它其实就是右边的m元线性方程组。当β=0时,方程实质上就是判断αi的相关性,对应方程组叫齐次线性方程组

(12)[a11a21an1]x1++[a1ma2manm]xm=[b1b2bn]{a11x1+a12x2++a1mxm=b1a21x1+a22x2++a2mxm=b2an1x1+an2x2++anmxm=bn

  在中学我们就已经知道用消元法解多元一次方程组,比如上面的方程组,先根据第一个等式得到x1的表达式,将它带入其它等式就得到m1元方程组。如此下去就可以得到一个一元方程,解出后回带到之前的表达式,就得到方程组的解。将方程的系数和常数项写成如下左边的增广矩阵,消元的过程可以表示为一系列如下初等变换。变换(1)可以将待消元的系数变为1,变换(2)是为了找到列数最小的非零系数,变换(3)进行消元。

  (1)第i行乘上一个非零常数k

  (2)交换第ij第行;

  (3)第j行加上第i的倍数k

(13)[a11a12a1mb1a21a22a2mb2an1an2anmbn][010010001]

  经过初等变换后,总可以使得每一行的首个非零系数的列数大于上一行,这样的矩阵叫阶梯形矩阵(式中的一个0可能表示若干个0)。每一个初等变换都是可逆的,所以阶梯型矩阵对应方程的解和原方程是一样的。解阶梯型方程时,总是从最后一个非零行开始,如果这一行只有最后一个常数项非零((14)式左),则方程组显然无解。如果正好对角线全为1((14)式中),则方程组有唯一解,否则((14)式右)某些未知数可取任意值,从而方程组有多组解。

(14)[01d1001d2000dn000][1d101d2001dm000][01d101clmdl000]

  这个方法就叫高斯消元法,最初由高斯给出详细过程。对齐次线性方程,可以没有增广矩阵的最后一列,从而方程组总有解。齐次方程若有唯一解,则必定为0,这时向量组线性无关。容易看出当m>n时,齐次方程总有非零解,这就说明m个向量总是线性相关的。线性方程组总可以用高斯消元法求解,这个过程可以交给计算机完成,但对具体的方程组,还可以通过一些技巧简化求解过程,请尝试以下习题。

   求解方程组{(1+a1)x1+x2++xn=b1x1+(1+a2)x2++xn=b2x1+x2++(1+an)xn=bn

   求解方程组{x1+2x2+3x3++nxn=b1nx1+x2+2x3++(n1)xn=b22x1+3x2++nxn1+xn=bn

  当线性方程组有多组解时,这个解的集合有什么特点呢?对于齐次方程(15),容易证明所有解组成一个线性空间,它称为方程的解空间,空间的基称为方程的基础解系。若列向量组的秩为r,将方程组阶梯化后,可将阶梯角上对应的rxi用另外的nr个线性表示。那nr个未知元是自由变化的,所以解空间的维数就是nr,基础解系也容易构造,进而可以表示出一般解(通解)。

(15)α1y1+α2y2++αmym=0

  对于非齐次方程(12),如果(x1,,xm),(x1,,xm)都是它的解,则显然(x1x1,,xmxm)是方程(15)的解。反之,对齐次方程(15)的任一解(y1,,ym)(x1+y1,,xm+ym)显然也是方程(12)的解。故只需得到方程(12)一个特解γ和(15)的解空间W,(12)的通解便可以表达为γ+W,在群论中它就是W的一个陪集。

posted on   卞爱华  阅读(3808)  评论(0编辑  收藏  举报

编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
历史上的今天:
2014-10-12 【集合论】 03 - 序集和序数

导航

点击右上角即可分享
微信分享提示