Schur 三角化定理的推论
将学习到什么
从 Schur 的酉三角化定理可以收获一批结果,在这一部分介绍重要的几个.
迹与行列式
相似矩阵具有相同的特征多项式, 从特征多项式一节中, 我们又知道,相似矩阵的迹以及行列式都是相同的,且分别用所有特征值的和与积表示,所以对于矩阵 \(A\in M_n\), \(\mathrm{tr}\,A\) 和 \(\mathrm{det}\,A\) 都可以用任何与 \(A\) 相似矩阵来计算,酉三角化中的上三角矩阵 \(T\) 的主对角线元素就是矩阵 \(A\) 的特征值,所以计算非常方便。
\(A\) 的多项式的特征值
假设 \(A\in M_n\) 有特征值 \(\lambda_1,\cdots\,\lambda_n\), 并设 \(p(t)\) 是一个给定的多项式,从特征值的特征向量的定理 1.1 知:对每一个 \(i=1,\cdots,n\), \(p(\lambda_i)\) 都是 \(p(A)\) 的特征值,又如果 \(\mu\) 是 \(p(A)\) 的特征值,那么就存在某个 \(i\in \{1,\cdots,n\}\), 使得 \(\mu=p(\lambda_i)\). 这些结论给出了 \(p(A)\) 的特征值,但没有给出它们的重数,Schur 定理揭示出它们的重数.
设 \(A=UTU^*\), 其中 \(U\) 是酉矩阵,而 \(T=[t_{ij}]\) 是上三角矩阵,其主对角元素是 \(t_{11}=\lambda_1,t_{22}=\lambda_2,\cdots,t_{nn}=\lambda_n\). 这样就有 \(p(A)=p(UTU^*)=Up(T)U^*\), \(p(T)\) 的主对角元素是 \(p(\lambda_1),p(\lambda_2),\cdots,p(\lambda_n)\), 故而由矩阵 \(T\) 的对角元素算出 \(p(T)\) 的特征值重数. 特别地,对每个 \(k=1,\cdots\), 矩阵 \(A^k\) 的特征值是 \(\lambda_1^k,\cdots,\lambda_n^k\), 且
\begin{align}
\mathrm{tr}\, Ak=\lambda_1k+\cdots+\lambda_n^k
\end{align}
假设 \(A\in M_n\), 如果对某个正整数 \(k\) 有 \(A^k=0\), 那么 \(\sigma(A)=\{0\}\), 所以 \(A\) 的特征多项式是 \(p_A(t)=t^n\), 其逆命题也成立,即如果 \(\sigma(A)=\{0\}\), 那么存在一个酉矩阵 \(U\) 以及一个严格上三角矩阵 \(T\), 使得 \(A=UTU^*\), 于是如下结论等价:\(A\) 是幂零的\(\Leftrightarrow A^n=0 \Leftrightarrow \sigma(A)=\{0\}\).
Cayley-Hamilton 定理
这个定理是说:设 \(p_A(t)\) 是 \(A\) 的特征多项式,那么 \(p_A(A)=0\).
通过多项式分解和酉相似,利用归纳法可以证明. 这个定理常常被解释成每个方阵都满足它自己的特征方程,不过这需要仔细加以理解:纯量多项式 \(p_A(t)\) 首先是作为 \(p_A(t)=\mathrm{det}\, (tI-A)\) 计算的,然后才是通过代换 \(t \rightarrow A\) 来计算矩阵 \(p_A(A)\).
Cayley-Hamilton 定理的一项重要用途是将 \(A\in M_n\) 的幂 \(A^k\) (对 \(k \geqslant n\))写成 \(I,A,A^2,\cdots,A^{n-1}\) 的线性组合. 比如 \(A=\begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}\). 那么 \(p_A(t)=t^2-3t+2\), 所以 \(A^2-3A+2I=0\), 从而 \(A^2=3A-2I\),\(A^3=(3A-2I)A=3A^2-2A=3(3A-2I)-2A=7A-6I\), 类似可计算 \(A^4,A^5,\cdots\) 等等. 还可以将非奇异矩阵 \(A\) 的负次数幂表示成 \(A\) 与 \(I\) 的线性组合,将 \(A^2-3A+2I=0\) 写成 \(I=A\Big[ \dfrac 12 (-A+3I) \Big]\), 从而 \(A^{-1}=-\dfrac 12 A+\dfrac 32 I\),同样可写出 \(A^{-2},A^{-3}\) 等等.
关于线性矩阵方程的 Sylvester 定理
与交换性有关的方程 \(AX-XA=0\) 是线性矩阵方程 \(AX-XB=C\) 的一个特例,通常称为Sylvester 方程.
这个定理不证明了,要了解定理中的那个充分必要条件.
Schur 三角化定理中的唯一性
对给定和 \(A \in M_n\),酉三角化 中定理 1.1 描述的那种可以通过酉相似得到的上三角型 \(T\) 不一定是唯一的. 也就是说,有相同主对角线的不同的上三角矩阵可能是酉相似的.
如果 \(T,T' \in M_n\) 是上三角的,且有相同的主对角线,主对角线上相同的元素归并在一起,关于使得 \(T'=WTW^*\) (也就是 \(WT=T'W\))成立的酉矩阵 \(W \in M_n\), 有什么特点?下面的定理说的是:\(W\) 必定是分块对角的,而且在关于 \(T\) 的超对角元素的某种假设之下,\(W\) 必定是对角矩阵,甚至是一个纯量矩阵,在后一种情形有 \(T=T'\).
每一个方阵都可以分块对角化
![](https://images2017.cnblogs.com/blog/1255644/201711/1255644-20171105154429529-1728361324.png)
秩 1 摄动的特征值
![](https://images2017.cnblogs.com/blog/1255644/201711/1255644-20171105161125826-159653689.png)
应该知道什么
- 酉三角化对于求矩阵的迹与行列式是方便的
- \(A\) 的多项式的特征值可以通过酉相似容易辨别出来
- 每个方阵都满足它自己的特征方程
- 每一个方阵都可以分块对角化
- 秩 1 摄动的特征值