将学习到什么
从 Schur 的酉三角化定理可以收获一批结果,在这一部分介绍重要的几个.
迹与行列式
相似矩阵具有相同的特征多项式, 从特征多项式一节中, 我们又知道,相似矩阵的迹以及行列式都是相同的,且分别用所有特征值的和与积表示,所以对于矩阵 A∈MnA∈Mn, trAtrA 和 detAdetA 都可以用任何与 AA 相似矩阵来计算,酉三角化中的上三角矩阵 TT 的主对角线元素就是矩阵 AA 的特征值,所以计算非常方便。
AA 的多项式的特征值
假设 A∈MnA∈Mn 有特征值 λ1,⋯λnλ1,⋯λn, 并设 p(t)p(t) 是一个给定的多项式,从特征值的特征向量的定理 1.1 知:对每一个 i=1,⋯,ni=1,⋯,n, p(λi)p(λi) 都是 p(A)p(A) 的特征值,又如果 μμ 是 p(A)p(A) 的特征值,那么就存在某个 i∈{1,⋯,n}i∈{1,⋯,n}, 使得 μ=p(λi)μ=p(λi). 这些结论给出了 p(A)p(A) 的特征值,但没有给出它们的重数,Schur 定理揭示出它们的重数.
设 A=UTU∗A=UTU∗, 其中 UU 是酉矩阵,而 T=[tij]T=[tij] 是上三角矩阵,其主对角元素是 t11=λ1,t22=λ2,⋯,tnn=λnt11=λ1,t22=λ2,⋯,tnn=λn. 这样就有 p(A)=p(UTU∗)=Up(T)U∗p(A)=p(UTU∗)=Up(T)U∗, p(T)p(T) 的主对角元素是 p(λ1),p(λ2),⋯,p(λn)p(λ1),p(λ2),⋯,p(λn), 故而由矩阵 TT 的对角元素算出 p(T)p(T) 的特征值重数. 特别地,对每个 k=1,⋯k=1,⋯, 矩阵 AkAk 的特征值是 λk1,⋯,λknλ1k,⋯,λnk, 且
假设 A∈MnA∈Mn, 如果对某个正整数 kk 有 Ak=0Ak=0, 那么 σ(A)={0}σ(A)={0}, 所以 AA 的特征多项式是 pA(t)=tnpA(t)=tn, 其逆命题也成立,即如果 σ(A)={0}σ(A)={0}, 那么存在一个酉矩阵 UU 以及一个严格上三角矩阵 TT, 使得 A=UTU∗A=UTU∗, 于是如下结论等价:AA 是幂零的⇔An=0⇔σ(A)={0}⇔An=0⇔σ(A)={0}.
Cayley-Hamilton 定理
这个定理是说:设 pA(t)pA(t) 是 AA 的特征多项式,那么 pA(A)=0pA(A)=0.
通过多项式分解和酉相似,利用归纳法可以证明. 这个定理常常被解释成每个方阵都满足它自己的特征方程,不过这需要仔细加以理解:纯量多项式 pA(t)pA(t) 首先是作为 pA(t)=det(tI−A)pA(t)=det(tI−A) 计算的,然后才是通过代换 t→At→A 来计算矩阵 pA(A)pA(A).
Cayley-Hamilton 定理的一项重要用途是将 A∈MnA∈Mn 的幂 AkAk (对 k⩾nk⩾n)写成 I,A,A2,⋯,An−1I,A,A2,⋯,An−1 的线性组合. 比如 A=[3−210]A=[31−20]. 那么 pA(t)=t2−3t+2pA(t)=t2−3t+2, 所以 A2−3A+2I=0A2−3A+2I=0, 从而 A2=3A−2IA2=3A−2I,A3=(3A−2I)A=3A2−2A=3(3A−2I)−2A=7A−6IA3=(3A−2I)A=3A2−2A=3(3A−2I)−2A=7A−6I, 类似可计算 A4,A5,⋯A4,A5,⋯ 等等. 还可以将非奇异矩阵 AA 的负次数幂表示成 AA 与 II 的线性组合,将 A2−3A+2I=0A2−3A+2I=0 写成 I=A[12(−A+3I)]I=A[12(−A+3I)], 从而 A−1=−12A+32IA−1=−12A+32I,同样可写出 A−2,A−3A−2,A−3 等等.
关于线性矩阵方程的 Sylvester 定理
与交换性有关的方程 AX−XA=0AX−XA=0 是线性矩阵方程 AX−XB=CAX−XB=C 的一个特例,通常称为Sylvester 方程.
这个定理不证明了,要了解定理中的那个充分必要条件.
Schur 三角化定理中的唯一性
对给定和 A∈MnA∈Mn,酉三角化 中定理 1.1 描述的那种可以通过酉相似得到的上三角型 TT 不一定是唯一的. 也就是说,有相同主对角线的不同的上三角矩阵可能是酉相似的.
如果 T,T′∈MnT,T′∈Mn 是上三角的,且有相同的主对角线,主对角线上相同的元素归并在一起,关于使得 T′=WTW∗T′=WTW∗ (也就是 WT=T′WWT=T′W)成立的酉矩阵 W∈MnW∈Mn, 有什么特点?下面的定理说的是:WW 必定是分块对角的,而且在关于 TT 的超对角元素的某种假设之下,WW 必定是对角矩阵,甚至是一个纯量矩阵,在后一种情形有 T=T′T=T′.
每一个方阵都可以分块对角化
证明: 将 TT 分划成
其中 S2=[Tij]di,j=2S2=[Tij]i,j=2d. 注意 T11T11 的仅有的特征值是 λ1λ1, 而 S2S2 的特征值是 λ2,⋯,λnλ2,⋯,λn. Sylvester 定理保证了方程 T11X−XS=−YT11X−XS=−Y 有一个解 XX,用它来构造
那么
如果 d=2d=2, 这就是所要的分块对角化. 如果 d>2d>2, 重复这一化简过程来证明 S2S2 与 T22⊕S3T22⊕S3 相似,其中 S3=[Tij]di,j=3S3=[Tij]i,j=3d. 经过 d−1d−1 次化简,我们就得知 TT 相似于 T11⊕⋯⊕TddT11⊕⋯⊕Tdd.
如果 AA 是实的且有实特征值,那么它与一个刚刚考虑过的实的分块上三角矩阵实正交相似,每一步的化简都可以用实相似来实现.
秩 1 摄动的特征值
证明: 设 ξ=x/∥x∥2ξ=x/‖x‖2, 并令 U=[ξu2⋯un]U=[ξu2⋯un] 是酉矩阵. 那么由 Schur 定理知
其中 A1∈Mn−1A1∈Mn−1 有特征值 λ2,⋯,λnλ2,⋯,λn. 又有
这样一来,
就有特征值 λ+v∗x,λ2,⋯,λnλ+v∗x,λ2,⋯,λn.
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步