500min 慢通线代
免责声明:本文是博主复习线代期末考试所用,并不适合所有人阅读,也并不保证所有内容完全正确。
教材:Linear Algebra, forth edition by S. H. Friedberg, A. J. Insel, L. E. Spence
本文将包含:
- 教材中大部分的定义;
- 教材中博主认为重要的定理,不那么显然的定理会带上简略证明过程;
- 博主的总结和浅薄的理解。
博主很懒,所以本文 latex 中不会出现 \mathbf
或 \mathsf
之类的字体,会略微降低阅读体验。
默认本文涉及到的所有变换均为线性变换。
关于有限维:涉及到 dim、有序基底或者矩阵等的线性空间默认加上有限维的前提。对于其他限制了有限维的情况,会额外标注。
Chapter 1 - Vector Spaces
域 F 上的线性空间 V
两种运算:加法、数乘。对于 ∀x,y∈V,存在唯一的 x+y∈V;对于 ∀x∈V,a∈F,存在唯一的 ax∈V。
需要满足八条性质:加法交换律、加法结合律、存在零元、存在加法逆元、存在幺元、数乘结合律、向量加法对数乘分配律、标量加法对数乘的分配律。
这些定义可以导出一些常用的代数性质。
子空间
定义无需多言。
判定就是对于 ∀x,y∈W,检查是否有 cx+y∈W,其中 c∈F。
子空间的交也是子空间。
线性组合
定义无需多言。
span(S):S 中元素的所有线性组合。显然其也是子空间。
若 span(S)=V,则称 S 生成 V。
线性相关 / 无关
定义无需多言。
基底
定义无需多言。
从一个生成 V 的有限集合 S 中构造基底:逐个添加并检查是否线性无关。
Replacement Theorem:设 |G|=n,V 是 G 生成的线性空间。令 L 为 V 的一个大小为 m 的线性无关子集,则存在 G 的大小为 n−m 的子集 H,使得 span(L∪H)=V。可以对 m 归纳证明。
V 的任意基底大小相同,可以通过 Replacement Theorem 证明。这个相同的大小记为 dim(V)。
V 中任意线性无关子集可以被扩展为一个基底。这是后面很多证明中常用的思路。
Chapter 2 - Linear Transformations and Matrices
线性变换
称 T:V→W 是线性变换当且仅当对于 ∀x,y∈V 有 T(cx+y)=cT(x)+y。
定义 T 的值域 R(T)={T(x)∣x∈V}、零空间 N(T)={x∣T(x)=0}。显然二者分别是 W 和 V 的子空间。
记 rank(T)=dim(R(T)),nullity(T)=dim(N(T)),则 dim(V)=rank(T)+nullity(T)。可以通过找到 N(T) 的一组基底然后扩展的方法证明。
矩阵表示
把基底的元素标号,可以得到有序基底。
对于向量 x 和有序基底 β,将用 β 表示 x 的系数按顺序排成一列,可以得到 x 在 β 下的矩阵表示,记为 [x]β。
对于线性变换 T:V→W,令 β,γ 分别为 V,W 的一组有序基底,定义 [T]γβ 为一个 dim(W)×dim(V) 的矩阵,其中第 j 列为 [T(βj)]γ。当 β=γ 时右上角可以省略 γ。
记 L(V,W) 为所有 V→W 的线性变换组成的集合,则 L(V,W) 也是一个线性空间,这意味着线性变换进行一些基础运算之后还是线性变换。
对于任意 x∈V,有 [T(x)]γ=[T]γβ[x]β。
线性变换复合后也依然是线性变换,有 [UT]γα=[U]γβ[T]βα。
此后若干定义会同时对线性变换和矩阵定义,不过基本是一样的。因为矩阵需要依赖基底而线性变换不用,我们可以用线性变换来理解矩阵,并证明矩阵的一些性质。
逆
定义无需多言。
T 可逆当且仅当其是双射,即同时为单射和满射。
若 T:V→W 可以,则称 V,W 同构。显然,在同一域 F 上的线性空间 V,W 同构当且仅当 dim(V)=dim(W)。
变换基底
令 I:V→V 为单位变换,且令 β,β′ 为两组有序基底,那么
由此我们可以定义矩阵的相似:称 n×n 矩阵 A 与 B 相似,当且仅当存在可逆矩阵 Q,使得 B=Q−1AQ。相似矩阵是同一线性变换在不同有序基底下的表示。
注意到 tr(AB)=tr(BA),所以相似的矩阵有相同的迹。事实上,考察 A 的特征多项式,我们可以发现 tr(A) 实际上就是其对应线性变换的特征值之和,与选取的有序基底无关,所以上述性质自然成立。
对偶空间
对于 F 上的线性空间 V,定义 V 的对偶空间为 V∗=L(V,F)。
显然 dim(V∗)=dim(V)。令 n=dim(V∗),则 V∗ 的一组基底为 {f1,f2,⋯,fn},其中 fi(βj)=[i=j]。
对于 T:V→W,定义 Tt:W∗→V∗,满足 Tt(g)=gT。不难发现 [Tt]β∗γ∗=([T]γβ)t。
类似定义 V∗∗。定义 ^x:V∗→F 满足 ^x(f)=f(x),那么 ψ:V→V∗∗ 满足 ψ(x)=^x 是双射。
可以发现,任意一组 V 的有序基底都可以与 V∗ 或 V∗∗ 的一组有序基底对应。
Chapter 3 - Elementary Matrix Operations and Systems of Lienar Equations
LU 分解
一个前提条件是高消的过程中没有交换两行的操作。
目标是找到 A=LU,使得 L 是下三角矩阵,而 U 是上三角矩阵。在高消的过程中直接记录即可,因为保证了不会交换两行所以合法。
于是我们在解 Ax=b 时只需要分别解 Ly=b 和 Ux=y。
其他
一些和秩、逆或者行列式有关的证明或操作可以考虑分解为初等矩阵。
线性变换复合之后秩不会比任意一个大。
Chapter 4 - Determinants
定义无需多言。教材上的定义是递归式的;一种等价的定义是排列式的。
det(AB)=det(A)det(B),这个可以通过将 A 分解为初等矩阵后根据行列式的基本性质证明。一个简单的推论是:当 A 可逆时 det(A−1)=det(A)−1。
A,B 不是方阵的情况见我 之前的博客,但是大概率没什么用。
det(At)=det(A),同样通过将 A 分解为初等矩阵后证明。
克拉默法则:设 A 为 n×n 的可逆矩阵,则 Ax=b 有唯一解。记 Mk 为将 A 的第 k 列替换为 b 得到的矩阵,则
非方阵
证明:令 x 为唯一解。记 Xk 为将 I 的第 k 列替换为 X 得到的矩阵,则 AXk=Mk。于是
Chapter 5 - Diagonalization
特征值、特征向量、特征空间
若 T:V→V,则称 T 为 V 上的线性算子。
对于线性算子 T 和 x∈V,x≠0,若 T(x)=λx,则称 λ 为 T 的特征值,且 x 为其对应的特征向量。
给定有序基底 β,令 A=[T]β,则 λ 为 T 的特征值当且仅当存在 x≠0 使得 Ax=λx,即 A−λI 的零空间不为 {0},即 det(A−λI)=0。称 f(t)=det(A−tI) 为 T 的特征多项式。
不同的特征值对应的特征向量线性无关。形式化地,设 T(xi)=λixi(i=1,2,⋯,k),其中 λi 两两不同,则 {x1,x2,⋯,xk} 线性无关。证明可以考虑对 k 归纳,假设 ∑aixi=0,同时对两侧施加 T−λkI 算子即可导出矛盾。
在 C 中,f(t)=0 有 n 个解。对于任意解 λ,称其在 n 个解中出现的次数为其的代数重数。令 λ 的特征空间为 Eλ 为 N(T−λI),称 dim(Eλ) 为其的几何重数。
几何重数介于 1 和代数重数之间。证明:考虑取 Eλ 的一个有序基底,并扩展为一个 V 的基底,求特征多项式可以发现 (λ−t)dim(Eλ) 是 f(t) 的一个因式。
T 可对角化当且仅当其所有特征值的几何重数等于代数重数。
如果在 R 上讨论这些问题,还需要考虑 f(t)=0 的解不都是实数的情况。
若 T 可对角化,则 V 为 T 的所有特征空间的直和。
T - 不变子空间
定义无需多言。
设 W 是 V 的 T - 不变子空间,TW 是把定义域缩减到 W 后的线性算子,则 TW 的特征多项式 fW 是 T 的特征多项式的因式。
证明:方法和证明几何重数介于 1 和代数重数之间的方法类似。取 W 的一个有序基底,并将其扩展为 V 的一个有序基底,则
其中 B1 对应 W 的有序基底部分。则 det(A−tI)=det(B1−tI)det(B3−tI)。
一个类似的结论:若 V=W1⨁W2⋯⨁Wk,其中 Wi 是 T - 不变子空间,记 fi 为 TWi 的特征多项式,则 f=∏fi。对 k 归纳证明即可。
对于 x,称 span({x,T(x),T2(x),⋯}) 为 x 生成的 T - 循环子空间。记其为 W,若 W 为有限维,记 k=dim(W),则 {x,T(x),⋯,Tk−1(x)} 是 W 的一个基底。设 ∑k−1i=0aiTi(x)+Tk(x)=0,则 TW 的特征多项式是 (−1)k(∑k−1i=0aiti+tk)。这个考察一下 [T]β 然后对 k 归纳一下即可。
Cayley–Hamilton Theorem:f(T)=T0,其中 T0(x)=0。证明就是顺水推舟:对于 ∀x∈V,考虑 x 生成的 T - 循环子空间 W,则根据其特征多项式的形式能直接得出 fW(TW)(x)=0;又因为其是 V 的子空间,所以 fW 是 f 的因式,故 f(T)(x)=0。
Chapter 6 - Inner Product Spaces
大的要来了。
内积
域 F 上的线性空间 V 上的内积 ⟨x,y⟩ 是满足以下条件的二元函数:
- ⟨x+z,y⟩=⟨x,y⟩+⟨z,y⟩;
- ⟨cx,y⟩=c⟨x,y⟩;
- ⟨x,y⟩=¯¯¯¯¯¯¯¯¯¯¯¯¯⟨y,x⟩;
- 若 x≠0,则 ⟨x,x⟩>0。
设 x=(a1,a2,⋯,an)t,y=(b1,b2,⋯,bn)t。定义 ⟨x,y⟩=∑ni=1ai¯¯¯¯bi 为 Fn 上的标准内积。
对于 m×n 的矩阵 A,定义 A∗ 为一个 n×m 的矩阵,满足 (A∗)ij=¯¯¯¯¯¯¯Aji。
带有特定内积运算的线性空间 V 称为内积空间。当 F=C 时,V 称为复内积空间;当 F=R 时,V 称为实内积空间。
若对于 ∀x 有 ⟨x,y⟩=⟨x,z⟩,则 y=z。
定义向量 x 的模长为 √⟨x,x⟩。
柯西不等式:|⟨x,y⟩|≤||x||⋅||y||。
证明:若 y=0 则结论显然成立。否则考虑
令 c=⟨x,y⟩⟨y,y⟩,则不等式变为
即证。
三角不等式:||x+y||≤|x|+|y|。可以拆开左侧然后通过柯西不等式证明。
正交
称 x,y 正交,当且仅当 ⟨x,y⟩=0。
称 x 是单位向量,当且仅当 ||x||=1。
称 V 的子集 S 是标准正交的,当且仅当其包含两两正交的单位向量。
定理:设 S={v1,v2,⋯,vk} 是 V 的一个正交子集,x∈span(S)。则
证明:令 x=∑iaivi。则
由此也可以得出,若 0∉S,则 S 是线性无关的。
证明:若 ∑iaivi=0,则对于 ∀p∈[1,k],有 ⟨∑iaivi,vp⟩=ap||vp||2=0,故 ap=0。
定理:设 S={w1,w2,⋯,wn} 是 V 的一个线性无关子集,我们可以通过如下方式得到正交子集 S′={v1,v2,⋯,vn},使得 span(S′)=span(S):对于 k=1,2,⋯,n,令
证明可以考虑直接对 k 归纳证明。
上面的过程被称为 Gram–Schmidt 过程。
于是,对于任意有限维内积空间 V,我们总能找到一组标准正交基 β={v1,v2,⋯,vn},则对于 ∀x∈V,有
对于任意线性算子 T,我们也能直接得到
对于 V 的标准正交子集 β={v1,v2,⋯} 和 x∈V,称 vi 为 ⟨x,vi⟩ 为 x 关于 β 的第 i 个傅里叶系数。
对于 V 的非空子集 S,令 S⊥={x∈V:∀y∈S,⟨x,y⟩=0}。显然 S⊥ 是 V 的子空间。
定理:令 W 是 V 的一个 有限维 子空间,y∈V,则存在唯一的 u∈W 和 z∈W⊥,满足 y=u+z。令 β={v1,v2,⋯,vk} 为 W 的一组标准正交基,则
证明:u∈W 和 z=y−u∈W⊥ 很显然,直接用内积证明即可。注意到 W∩W⊥={0},于是假设 y=u+z=u′+z′,则 u−u′∈W,z′−z∈W⊥,而 u−u′=z′−z,故 u=u′,z=z′。
从几何上理解,u 是 W 中距离 y 最近的点。可以通过对于 ∀x∈W,有 ||y−x||2=||(u−x)+z||2=||u−x||2+||z||2≥||z||2 来证明。
u 被称为 y 在 W 上的正交投影。
对于内积空间 V 和其 有限维 子空间 W,有 V=W⨁W⊥。
伴随
定理:令 V 为 有限维 内积空间。任意 V→F 的线性变换可以看作求与特殊向量的内积。形式化地,令 g:V→F,则存在 y∈V,使得对于 ∀y∈V 有 g(x)=⟨x,y⟩。
证明:令 β={v1,v2,⋯,vn} 为 V 的一组标准正交基。直接令 y=∑i¯¯¯¯¯¯¯¯¯¯¯g(vi)vi 即可,正确性应该是显然的。
同时,显然这样的 y 是唯一的。
定理:令 V 为 有限维 内积空间,T 为 V 上的线性算子。存在唯一的线性算子 T∗,使得对于 ∀x,y∈V 有 ⟨T(x),y⟩=⟨x,T∗(y)⟩。
证明:首先考虑固定 y,令 g(x)=⟨T(x),y⟩。根据上一个定理,存在 y′∈V 使得对于 ∀x∈V 有 g(x)=⟨x,y′⟩,令 T∗(x)=y′ 即可。
接下来我们需要证明 T∗ 是线性的。因为对 ∀x 有
所以 T∗(cy1+y2)=cT∗(y1)+T∗(y2),因此 T∗ 是线性的。因为对于每个 y,T∗(y) 有唯一的取值,所以 T∗ 是唯一的。
T∗ 称为 T 的伴随算子。
定理:令 V 为 有限维 内积空间,T 为 V 上的线性算子,β={v1,v2,⋯,vn} 为 V 的一组标准正交基。则 [T∗]β=[T]∗β。
证明:[T∗]βij=⟨T∗(vj),vi⟩=¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯⟨vi,T∗(vj)⟩=¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯⟨T(vi),vj⟩=¯¯¯¯¯¯¯¯¯¯¯[T]βji。
由此可见,T∗∗=T。
最小二乘法
平面上有 n 个点 (t1,y1),(t2,y2),⋯,(tn,yn),其中 ti 两两不同。需要用一条直线 y=ct+d 拟合这 n 个点,使得误差最小。误差定义为 ∑i(yi−cti−d)2。
做法:令
我们实际上要最小化 ||y−Ax||2。我们不妨考虑 A 是任意 m×n 矩阵的情况,此时我们在 R(A) 中找离 y 最近的点,所以最优的 x 满足 y−Ax⊥R(A)。也就是 A∗(y−Ax)=0,可以理解为 x 与 A 的每一列与 y−Ax 的内积为 0。所以最优的 x 满足 A∗Ax=A∗y。
注意到对于 ∀x≠0,有 A∗Ax=0⇔x∗A∗Ax=0⇔⟨Ax,Ax⟩=0⇔Ax=0,显然 N(A∗A)=N(A),所以当 rank(A)=n 时,x=(A∗A)−1A∗y。
书上证明 rank(A∗A)=rank(A) 的表述方式是首先注意到 ⟨Ax,y⟩m=⟨x,A∗y⟩n,然后说明 ⟨A∗Ax,x⟩n=⟨Ax,Ax⟩m,和上面方法的区别只是表述方式的不同。
线性方程组的最小解
同理,设一个特解为 u,则解空间为 u+N(A)。最优解需要与 N(A) 垂直,因为 N(A)⊥=R(A∗) 所以最优解为 R(A∗) 中的解。更具体地,AA∗x=b 有解 x=x′,最优解即 x=A∗x′。显然解存在且唯一。
正规算子、自轭算子
定理:若线性算子 T 有特征值 λ,则 T∗ 有特征值 ¯¯¯λ。
证明:若存在 x≠0 使得 T(x)=λx,则对于 ∀y∈V,有
由此可见,x⊥R(T∗−¯¯¯λI),即 N(T∗−¯¯¯λI)≠{0},故 ¯¯¯λ 是 T∗ 的特征值。
舒尔定理:令 V 为 有限维 内积空间,T 为 V 上的线性算子,若 T 的特征多项式可分解,则存在标准正交基 β 使得 [T]β 是上三角矩阵。
证明:取一组使得 [T]β 是对角矩阵的基底,然后对其执行 Gram–Schmidt 过程即可。
若 TT∗=T∗T,则称 T 为正规算子。
下面介绍一些正规算子的基本性质:
定理:若 T 是正规算子,则对于 ∀x 有 ||T(x)||=||T∗(x)||。
证明:
定理:若 T 是正规算子,则对于 ∀c∈F,T−cI 也是正规算子。
证明:直接拆开就行。
定理:若 T 是正规算子,T(x)=λx,则 T∗(x)=¯¯¯λx。
证明:令 U=T−λI,由上一个定理立得 U 正规,于是结论显然。
定理:若 T 是正规算子,则 T 的任意两个不同的特征空间垂直。
一个推论是,N(T)=N(T∗),当 V 为 有限维 内积空间时 R(T)=R(T∗)。
证明:设 T(x1)=λ1x1,T(x2)=λ2x2(λ1≠λ2),则
定理:C 上的内积空间 V 上的线性算子 T 正规,当且仅当存在 V 的标准正交基 β={v1,v2,⋯,vn},使得 vi 是 T 的特征向量。
证明:假设 T 正规,则根据舒尔定理,存在一组标准正交基 β={v1,v2,⋯,vn},使得 A=[T]β 是上三角矩阵。接下来归纳证明 A 是对角矩阵,核心公式为
其中 1≤j<k≤n,利用了 T 和 T∗ 共享特征向量的性质。
若存在 V 的标准正交基 β={v1,v2,⋯,vn},使得 vi 是 T 的特征向量,则 T 正规是显然的。
若 T=T∗,则称 T 为自轭算子。
若 T 自轭,显然 T 正规,因此 T 和 T∗ 共享特征向量。因此对于 T 的任意特征值 λ 有
因此 T 的所有特征值为实数。
定理:R 上的内积空间 V 上的线性算子 T 自轭,当且仅当存在 V 的标准正交基 β={v1,v2,⋯,vn},使得 vi 是 T 的特征向量。
证明:和上一个定理的证明没什么区别。只在 R 上成立的关键条件是是 D∗=D。
可以看出,对于 R 上的内积空间 V,正规和自轭等价。
酉算子
若对 ∀x∈V 有 ||T(x)||=||x||,则称 T 为酉算子(F=C)或正交算子 F=R。
以下四个命题等价:
- TT∗=T∗T=I;
- 对 ∀x,y∈V,有 ⟨T(x),T(y)⟩=⟨x,y⟩;
- 令 β={v1,v2,⋯,vn} 为 V 的一组标准正交基,则 T(β) 也是一组标准正交基;
- 对 ∀x∈V 有 ||T(x)||=||x||。
1→2 证明:
对 ∀x,y∈V,有
2→3 证明:
对 ∀1≤i,j≤n,有 ⟨T(vi),T(vj)⟩=⟨vi,vj⟩=[i=j]。显然 T(β) 也是一组标准正交基。
3→4 是显然的,把 T(x) 拆开即可。
4→1 证明:
对于 ∀x,有 ⟨x,x⟩=⟨T(x),T(x)⟩=⟨x,T∗T(x)⟩,故 ⟨x,(T∗T−I)(x)⟩=0。故 T∗T=TT∗=I。
酉算子和自轭算子的交是所有特征值为 ±1 的正规算子。
酉算子的 T - 不变子空间的正交空间仍然是 T - 不变子空间。反例是构造一条首尾均无限的链并考察其前一半。
称 A 与 B 酉等价,当且仅当存在酉矩阵 Q,使得 B=Q∗AQ。
因为 Q∗=Q−1,所以酉等价依然可以看作是用不同基底刻画同一线性变换,不过对基底的关系加上了酉矩阵的限制。因此 det(A)=det(B),以及对于 ∀x,都有 ||Ax||=||Bx||。
显然,T 正规当且仅当其与一个对角矩阵酉等价。
刚体运动(真的会考吗?)
copied from 小子要 blog。
称 f 是刚体运动当且仅当对于任意 x,y 有 ||x−y||=||f(x)−f(y)||。
对于实内积空间 V 上的刚体运动 f:V→V,V 上存在唯一的正交算子 T 以及唯一的平移 g 满足 f=gT。
在 R2 上,正交算子要么是 det=1 的旋转,要么是 det=−1 的反射(反射轴过原点)。
R2 上旋转 θ 度:(cosθ−sinθsinθcosθ);沿倾斜角为 θ 的直线反射:(cos2θsin2θsin2θ−cos2θ)。
正交投影与谱定理
对于内积空间 V,令 V=W1⨁W2。则对于 ∀x,存在唯一的 x1∈W1 和 x2∈W2,使得 x=x1+x2。此时称 T(x)=x1 为 W1 沿 W2 的投影。
对于任意投影 T,有 R(T)=W1,N(T)=W2,所以 V=R(T)⨁N(T)。
如果 N(T)=R(T)⊥ 且 R(T)=N(T)⊥,则称 T 为正交投影。在 V 为 有限维 内积空间时,两个条件是等价的。
定理:T 是正交投影当且仅当 T2=T=T∗。
证明:假设 T 是正交投影。因为 T 是投影,显然 T2=T。对于 ∀x,y∈V,有
故 T=T∗。
现在假设 T2=T=T∗。首先由 T2=T 得到 R(T)∩N(T)={0},再由 x=T(x)+(x−T(x)) 得到 R(T)+N(T)=V,于是 R(T)⨁N(T)=V,T 是投影。
接下来只需要证明 T 是正交投影,即证 N(T)=R(T)⊥ 且 R(T)=N(T)⊥。这个过程不难想但是有点难写,在此略过。
谱定理:设 T 的互不相同的特征值为 λ1,λ2,⋯,λk,对应的特征空间分别为 W1,W2,⋯,Wk,设 V 到 Wi 的投影为 Ti。若 T 是正规的,那么以下命题成立:
- V=⨁ki=1Wi;
- W⊥i=⨁j≠iWj
- TiTj=[i=j]Ti;
- I=∑ki=1Ti;
- T=∑ki=1λiTi。
结合之前的知识,这听起来有点像废话,所以我们略过证明。
定理:F=C 时,T 正规当且仅当存在多项式 g,使得 T∗=g(T)。
证明:若 T 正规,令 T=∑iλiTi,则 T∗=∑i¯¯¯¯¯λiTi。我们构造多项式 g,使得 g(λi)=¯¯¯¯¯λi 即可。
若存在 g,因为 Tg(T)=g(T)T,显然 T 正规。
重点是利用正交投影的性质说明 g(T)=∑ig(λi)Ti。
定理:F=C 时,T 是酉算子当且仅当 T 正规,且 T 的所有特征值模长为 1。
证明:不难发现 TT∗=∑i|λi|2Ti。
定理:F=C 时,T 自轭当且仅当 T 正规,且 T 的所有特征值都是实的。
证明:显然。
定理:每个 Ti 可以表示为关于 T 的多项式。
证明:构造多项式 g,使得 g(λj)=[i=j] 即可。
正定 / 半正定算子
copied from 小子要 blog,其实是作业题。
称 T 正定 / 半正定,当且仅当其自轭,且对于 ∀x 有 ⟨T(x),x⟩>0/≥0。
一些性质:
T 正定 / 半正定当且仅当其所有特征值 ⟩0/≥0。
T 半正定当且仅当存在方阵 B 使得 [T]=B∗B。
证明:若 T 半正定,令 [T]=Q∗DQ,将 D 分解为 √D×√D,加入两侧即可。
若 [T]=B∗B,显然 T 半正定。
若半正定算子 T,U 满足 T2=U2,则 T=U。
证明:设 U2(x)=T2(x)=λ2(x)。λ=0 的情况是平凡的。对于 λ>0 的情况,(U+λI)(U−λI)(x)=0,只有 U(x)=λx。同理 T(x)=λx,故 U=T。
若 U,T 正定且可交换,则 UT 正定。
证明:找到一组由 U 和 T 共同的的特征向量组成的标准正交基之后容易说明。
酉等价的算子正定性相同。
谱定理带来的一些不等式
令 T=∑iλiTi,x=∑ixi,其中 xi∈Ei,则 ⟨x,T(x)⟩=∑i⟨xi,λixi⟩=∑iλi||xi||2。而 ||x||2=∑||xi||2,所以我们能够得到 ⟨x,T(x)⟩||x|| 的一个范围,即 [minλ,maxλ]。
若 T,U 自轭,T 的特征值在 [minλ,maxλ] 内、U 的特征值在 [minμ,maxμ] 内,则我们可以得到:T+U 的特征值在 [minλ+minμ,maxλ+maxμ] 内,原因显然。
若 T∗T 的特征值在 [minλ,maxλ] 内,则 T 的特征值绝对值在 [√minλ,√maxλ] 内,原因是令 A=[T],则 ⟨x,T(x)⟩=x∗A∗Ax=||T(x)||2。
奇异值分解
奇异值分解用于对非方阵进行对角化。它把任意 m×n 矩阵 A 分解为 UΣV∗,其中 U,V 是酉矩阵、Σ 是 m×n 对角矩阵,且对角元素单调不增。
做法:注意到 A∗A=VΣ2V∗,而 A∗A 是半正定的,考虑用标准正交基底将其对角化,即令 A∗A=Q∗DQ,则 V=Q,Σ=√D;可以类似通过 AA∗ 求 U,也可以根据 UΣ=AV,考虑第 j 列得到 σjuj=Avj。
半正定方阵的奇异值与特征值相同。
正定方阵的奇异值分解中 U=V。
极分解
对于任意方阵 A,存在唯一的分解 A=WP,其中 W 是酉矩阵、P 是半正定矩阵。
构造:A=UΣV∗=(UV∗)(VΣV∗)。
唯一性:A=WP=ZQ⇒Z∗W=QP−1。于是 QP−1 是酉矩阵,P=Q。
双线性型与二次型
对于 H:V×V→F,若 H(x,y) 在 x,y 上都线性,则称 H 是双线性型。
对于有序基底 β,H 的矩阵表示为 ψβ(H) 满足 ψβ(H)ij=H(vi,vj)。对于 ∀x,y,有 H(x,y)=[x]tβψβ(H)[y]β。
所以对于有序基底 β 和 γ,令 Q=[I]βγ,则 ψγ(H)=Qtψβ(H)Q。
对于矩阵 A,B,若存在矩阵 Q,使得 B=QtAQ,则称 A,B 相合。
相合是用不同的有序基底刻画同一个双线性型。
若 H 满足对于 ∀x,y∈V 有 H(x,y)=H(y,x),则称 H 是对称的。
显然,H 对称当且仅当 ψβ(H) 对称。
若 H 满足存在一个有序基底 β,使得 ψβ(H) 是对角矩阵,则称 H 是可对角化的。
定理:在特征不为 2 的域中,任意对称的 H 都可对角化。
证明:可以使用类似于高斯消元的方法对角化。但是不能进行交换两行的操作,主元为 0 时需要从后面加过来。
对于函数 K:V→F,若存在双线性型 H 满足 K(x)=H(x,x),则称 K 为二次型。
在特征不为 2 的域中,H(x,y)=12(K(x+y)−K(x)−K(y))。
定理:存在标准正交基 β={v1,v2,⋯,vn},使得对于任意 x=∑iaivi,有 K(x)=∑iλia2i。
证明:将 H 正交对角化即可。
一个用处是说明解集形如椭球。
Chapter 7 - Canonical Forms
若基底 β 使得
其中 Ai 形如
则 [T]β 被称为 T 的 Jordan 标准形,β 被称为 Jordan 标准基,Ai 被称为 Jordan 块。
对于任意 λ,若 x≠0 满足存在正整数 p 使得 (T−λI)p(x),则称 x 为 T 关于 λ 的广义特征向量。
记 Kλ 表示 T 关于 λ 的所有广义特征向量的集合。显然 Kλ 也是线性空间,称为广义特征空间。
因为 (T−λI)p 是关于 T 的多项式,所以其和 T 是可交换的。因此 (T−λI)pT(x)=T((T−λI)p(x)),所以 Kλ 是 T - 不变的。
定理:对于 μ≠λ,T−μI 在 Kλ 上的限制为单射。
证明:令 x≠0∈Kλ 使得 (T−μI)(x)=0。令 p 为最小的正整数使得 (T−λI)p(x)=0。令 y=(T−λI)p−1(x),则 y≠0∈Eλ。同时因为 (T−μI)(y)=(T−μI)(T−λI)p−1(x)=(T−λI)p−1(T−μI)(x)=0,所以 y∈Eμ。故 y∈Eλ∩Eμ={0},矛盾。所以为单射。
定理:对于 μ≠λ,Eμ∩Eλ={0}。
证明:因为 T−μI 在 Kλ 上的限制为单射,所以对于 ∀x≠0 和正整数 p,有 (T−μI)p≠0,即证。
定理:设 T 的特征值 λ 的代数重数为 m,则
- dim(Kλ)≤m;
- Kλ=N((T−λI)m)。
证明:
-
显然 T 在 Kλ 上的限制的所有特征值都是 λ,而 Kλ 是 V 的子空间,显然 dim(Kλ)≤m。
-
令 d=dim(Kλ),则 T 在 Kλ 上的限制的特征多项式为 f(t)=(−1)d(t−λ)d。将 T 代入多项式,我们得到 f(T)=0,即 (T−λI)d=T0。而 d≤m,显然 Kλ=N((T−λI)m)。
定理:V=∑ki=1Kλi。
证明:对 k 归纳。当 k=1 时,f(t)=(−1)m(t−λ1)m,故 (T−λI)m=T0,所以 Kλ1=V。
考虑 k>1 的情况,怎么这么长,不证了。
于是我们可以得到:V=⨁ki=1Kλi,并且每个 dim(Kλi) 都等于其代数重数。于是 V 必然可以分解为 Jordan 标准形。
好像 xy 上课讲了很高级的做法,有没有老哥教教啊????
Jordan 标准基的计算:
-
对于每个 Kλ:求出 Eλ 的基底,然后尝试解方程扩展到层数高的基底。
-
先根据 Jordan 标准基的结构求出 J,然后通过 QJ=AQ 解出 Q。
The Minimal Polynomial
若多项式 p 满足 p(T)=T0,则称其为零化多项式。
最小多项式是所有零化多项式中度数最小且首项为 1 的多项式。不难发现它是唯一的。
求最小多项式:
- 方法一:求出特征多项式,逐个检查每个因式是否能去掉。
- 方法二:求出 Jordan 标准形,对每个特征值选最大的 Jordan 块作为次数。
2025.1.3 update:感谢 xcyle 和 zzh 指出一个错误。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具