实 Jordan 标准型和实 Weyr 标准型
将学习到什么
本节讨论关于实矩阵的实形式的 Jordan 标准型,也讨论关于复矩阵的另外一种形式的 Jordan 标准型,因为它在与交换性有关的问题中很有用.
实 Jordan 标准型
假设 \(A \in M_n(\mathbb{R})\), 所以任何非实的特征值必定成对共轭出现,由于结任何 \(\lambda \in \mathbb{C}\), 以及所有 \(k=1,2,\cdots\) 我们有 \(\mathrm{rank} \, (A-\lambda I)^k= \mathrm{rank} \, \overline{(A-\lambda I)^k}=\mathrm{rank} \, \overline{(A-\lambda I)}^k=\mathrm{rank} \, (A-\bar{\lambda} I)^k\), 所以我们断定 \(A\) 的各种阶的有非实特征值的 Jordan 分块中,同阶的分块总是共轭成对出现. 比如,如果在 \(A\) 的 Jordan 标准型中有 \(k\) 个分块 \(J_2(\lambda)\), 那么有 \(k\) 个分块 \(J_2(\bar{\lambda})\), 分块对角矩阵
\begin{align}
\begin{bmatrix} J_2(\lambda) & \\ 0 & J_2(\bar{\lambda}) \end{bmatrix} = \left [ \begin{array}{cc|cc} \lambda & 1 & \\ 0 & \lambda & & \\ \hline & & \bar{\lambda} & 1 \\ && 0& \bar{\lambda} \end{array} \right ]
\end{align}
通过交换 2,3 行以及 2,3 列,其置换相似于分块上三角矩阵
\begin{align}
\left [ \begin{array}{cc|cc} \lambda & 0 & 1 & 0 \\ 0 & \bar{\lambda} & 0 & 1 \\ \hline & & \lambda & 0 \\ && 0& \bar{\lambda} \end{array} \right ] =\begin{bmatrix} D(\lambda) & I_2 \\ & D(\lambda) \end{bmatrix}
\end{align}
其中 $ D(\lambda)=\begin{bmatrix} \lambda & 0 \\ 0 & \bar{\lambda} \end{bmatrix} \in M_2$.
一般来说,形如
\begin{align} \label{e1}
\begin{bmatrix} J_k(\lambda) & \\ 0 & J_k(\bar{\lambda}) \end{bmatrix} \in M_{2k}
\end{align}
的 Jordan 矩阵置换相似于分块上三角(分块双对角)矩阵
\begin{align} \label{e4}
\begin{bmatrix} D(\lambda) & I_2 & & & \\ & D(\lambda) & I_2 & & \\ & & \ddots & \ddots & \\ &&& \ddots & I_2 \\ &&&& D(\lambda) \end{bmatrix} \in M_{2k}
\end{align}
实现地时候可按照上述举例方法一步步上移,注意避免下对角出现非零元素. 它在分块主对角线上有 \(k\) 个 \(2 \times 2\) 的块 \(D(\lambda)\), 且分块超对角线上有 \(k-1\) 个分块 \(I_2\).
设 \(\lambda=a+\mathrm{i}b, a,b \in \mathbb{R}\). 计算表明 \(D(\lambda)\) 相似于实矩阵
\begin{align} \label{e111}
C(a,b):=\begin{bmatrix} a & b \\ -b & a \end{bmatrix} =SD(\lambda)S^{-1}
\end{align}
其中 \(S=\begin{bmatrix} -\mathrm{i} & -\mathrm{i} \\ 1 & -1 \end{bmatrix}\), 而 \(S^{-1}=\dfrac{1}{2\mathrm{i}}\begin{bmatrix} -1 & \mathrm{i} \\ -1 & -\mathrm{i} \end{bmatrix}\). 此外,对非实的 \(\lambda\), 每一个形如 \ref{e4} 的分块矩阵都通过相似矩阵 \(S\oplus \cdots \oplus S\)(\(k\) 个直和项)与形如
\begin{align} \label{e3}
C_k(a,b):=\begin{bmatrix} C(a,b) & I_2 & & & \\ & C(a,b) & I_2 & & \\ & & \ddots & \ddots & \\ &&& \ddots & I_2 \\ &&&& C(a,b) \end{bmatrix} \in M_{2k}
\end{align}
的实分块矩阵相似. 从而每一个形如 \ref{e1} 的分块对角矩阵都相似于 \ref{e3} 中的矩阵 \(C_k(a,b)\). 这些结论将我们引导到实 Jordan 标准型定理.
定理1: 每一个 \(A \in M_n{\mathbb{R}}\) 都通过一个实相似与一个形如
\begin{align} \label{e5}
C_{n_1}(a_1,b_1) \oplus \cdots \oplus C_{n_p}(a_p,b_p) \oplus J_{m_1}(\mu_1) \oplus \cdots \oplus J_{m_r}(\mu_r)
\end{align}
的实分块对角矩阵相似,其中 $\lambda_k=a_k+\mathrm{i}b_k(k=1,2,\cdots p) $ 是 \(A\) 的非实特征值,每一个 \(a_k\) 以及 \(b_k\) 都是实的,且 \(b_k >0\), 而 \(\mu_1,\cdots,\mu_r\) 是 \(A\) 的实特征值. 每一个实的分块三角矩阵 \(C_{n_k}(a_k,b_k) \in M_{2n_k}\) 都有 \ref{e3} 的形式,且与 \(A\) 的 Jordan 标准型中与非零的实特征值 \(\lambda_k\) 相关的一对共轭 Jordan 块 \(J_{n_k}(\lambda_k),J_{n_k}(\overline{\lambda_k}) \in M_{n_k}\) 相对应. \ref{e5} 中的实的 Jordan 块 \(J_{m_k}(\mu_k)\) 就是Jordan 标准型中有实特征值的那些 Jordan 块.
分块矩阵 \ref{e5} 就是 \(A\) 的实 Jordan 标准型. 下面的推论总结了另外几个与实矩阵相似的有用和判别法.
推论1: 设给定 \(A \in M_n\). 则以下诸命题等价:
(a) \(A\) 与一个实矩阵相似.
(b) 对 \(A\) 的每个非零特征值 \(\lambda\) 以及每个 \(k=1,2,\cdots\), 分块 \(J_k{\lambda}\) 以及 \(J_k{\bar{\lambda}}\) 各自的个数相等.
(c) 对 \(A\) 的每个非实特征值 \(\lambda\) 以及每个 \(k=1,2,\cdots\), 分块 \(J_k{\lambda}\) 以及 \(J_k{\bar{\lambda}}\) 各自的个数相等.
(d) 对 \(A\) 的每个非实特征值 \(\lambda\) 以及每个 \(k=1,2,\cdots\), \(\mathrm{rank}\, (A-\lambda I)^k=\mathrm{rank}\,(A-\bar{\lambda}I)^k\).
(e) 对 \(A\) 的每个非实特征值 \(\lambda\) 以及每个 \(k=1,2,\cdots\), \(\mathrm{rank}\, (A-\lambda I)^k=\mathrm{rank}\,(\bar{A}-\lambda I)^k\).
(f) 对 \(A\) 的每个非实特征值 \(\lambda\), \(A\) 与 \(\lambda\) 以及与 \(\bar{\lambda}\) 相关的 Weyr 特征是相同的.
(g) \(A\) 与 \(\bar{A}\) 相似.
推论2: 如果 \(A = \begin{bmatrix} B & C \\ 0 & 0 \end{bmatrix} \in M_n\), 而 \(B \in M_m\) 与一个实矩阵相似,那么 \(A\) 与一个实矩阵相似.
证明:假设 \(S\in M_m\) 是非奇异的,且 \(SBS^{-1}=R\) 是实的. 那么 \(\mathcal{A} =(S \oplus I_{n-m})A(S \oplus I_{n-m})^{-1}= \begin{bmatrix} R & \bigstar \\ 0 & 0 \end{bmatrix}\) 与 \(A\) 相似. 现在只要证明 \(\mathcal{A}\) 与实矩阵相似就好了. 如果 \(\lambda \neq 0\), 那么
\begin{align}
(\mathcal{A}-\lambda I)^k = \begin{bmatrix} (R-\lambda I)^k & \bigstar \\ & (-\lambda)^k I_{n-m} \end{bmatrix} \notag
\end{align}
与
\begin{align}
(\bar{\mathcal{A}}-\lambda I)^k = \begin{bmatrix} (R-\lambda I)^k & \bigstar \\ & (-\lambda)^k I_{n-m} \end{bmatrix} \notag
\end{align}
的列秩相同:\(n-m+\mathrm{rank}(R-\lambda I)^k\). 我们断言 \(\mathcal{A}\) 与 \(\bar{\mathcal{A}}\) 相似,所以 \(\mathcal{A}\) 与实矩阵相似.
推论3: 对每个 \(A\in M_n\), \(A\bar{A}\) 与 \(\bar{A}A\) 相似,也与一个实矩阵相似.
证明: \(A \bar{A}\) 与 \(\bar{A} A\) 的非奇异的 Jordan 构造是相同的. 由于矩阵与它的复共轭有同样的秩,对每个 \(k=1,2,\cdots\) 有 \(\mathrm{rank} (A \bar{A})^k= \mathrm{rank} \overline{(A \bar{A})^k} = \mathrm{rank} \overline{(A \bar{A})}^k= \mathrm{rank} (\bar{A} A )^k\). 于是,\(A\bar{A}\) 与 \(\bar{A}A\) 的幂零部分的 Jordan 构造也是相同的,所以 \(A\bar{A}\) 与 \(\bar{A}A\) 相似. 由于 \(\bar{A}A=\overline{A \bar{A}}\), 所以 \(A \bar{A}\) 与一个实矩阵相似.
由 Schur 型知,每个复方阵 \(A\) 通过一个复相似而与一个复的上三角矩阵 \(T\) 相似. 如果 \(A\) 可以对角化,对么它通过一个复相似而与一个对角矩阵相似,且这个对角矩阵的对角元素与 \(T\) 的对角元素相同,这些元素就是 \(A\) 的特征值. 那么这个结论的实的类似结果 是什么?
每一个实方阵 \(A\) 通过一个实相似与一实的上拟三角矩阵 \(T\) 相似,其中任何 \(2 \times 2\) 对角分块都有特殊的形式(\ref{e111}). 如果 \(A\) 可以对角化,则实 Jordan 标准型定理的如下推论就确保 \(A\) 通过一个实相似与一个实的拟对角矩阵相似,它的对角分块与 \(T\) 的对角分块相同.
推论4: 设给定 \(A\in M_n(\mathbb{R})\), 并假设它可以对角化. 设 \(\mu_1,\cdots, \mu_q\) 是 \(A\) 的实特征值,并设 \(a_1 + \mathrm{i} b_1, \cdots, a_1 + \mathrm{i} b_{\ell}\) 是 \(A\) 的非实特征值,其中每个 \(b_j >0\). 那么 \(A\) 通过一个实相似与
\begin{align}
C_1(a_1, b_1) \oplus \cdots \oplus C_1(a_{\ell}, b_{\ell}) \oplus [\mu_1] \oplus \cdots \oplus [\mu_q]
\end{align}
相似.
证明: 这是式 (\ref{e5}) 中 \(n_1 = \cdots =n_p=m_1=\cdots = m_r=1\) 的情形.
Weyr 标准型
基本定义
Weyr 特征在我们关于 Jordan 标准型的唯一性的讨论中起着关键的作用,它还可以用来定义一种相似标准型. 我们先来定义 Weyr 分块.
设给定 \(\lambda \in \mathbb{C}\), 设 \(q \geqslant 1\) 是给定的正整数,\(w_1 \geqslant \cdots \geqslant w_q \geqslant 1\) 是给定的由正整数组成的非增序列,又设 \(w_1=(w_1,\cdots,w_q)\). 与 \(\lambda\) 以及 \(w\) 相关的 Weyr 分块 \(W(w,\lambda)\) 是上三角的 \(q \times q\) 分块双对角矩阵
\begin{align}
W(w,\lambda)=\begin{bmatrix} \lambda I_{w_1} & G_{w_1,w_2} &&& \\ & \lambda I_{w_2} & G_{w_2,w_3} && \\ && \ddots & \ddots & \\ &&& \ddots & G_{w_{q-1},w_q} \\ &&&& \lambda I_{w_q} \end{bmatrix}
\end{align}
其中
\begin{align} \label{e222}
G_{w_i,w_j}=\begin{bmatrix} I_{w_j} \\ 0 \end{bmatrix} \in M_{w_i,w_j}, \qquad 1 \leqslant i < j
\end{align}
注意到 \(\mathrm{rank}\, G_{w_i,w_j}=w_j\), 且如果 \(w_i=w_{i+1}\), 则有 \(G_{w_i,w_{i+1}}=I_{w_i}\).
Weyr 分块 \(W(w,\lambda)\) 可以被看成为与 Jordan 分块相似的 \(q \times q\) 分块矩阵. 对角分块是按照阶的大小不增的次序排列的纯量矩阵 \(\lambda I\), 而超对角线分块是列满秩的块 \(\begin{bmatrix} I \\ 0 \end{bmatrix}\), 它的大小是由对角分块的大小所决定的.
式 (\ref{e222}) 中 Weyr 分块 \(W(w,\lambda)\) 的大小是 \(w_1+\cdots +w_q\), 由于 \(G_{w_i,w_{i+1}}\) 都是列满秩的块,所以
\begin{align}
\mathrm{rank}(W(w,\lambda)-\lambda I) = w_2 +\cdots + w_q
\end{align}
直接计算可验证 \(G_{w_{k-1},w_k} G_{w_k,w_{k+1}}=G_{w_{k-1},w_{k+1}}\), 即
\begin{align}
\begin{bmatrix} I_{w_k} \\ 0_{w_{k-1}-w_k, w_k} \end{bmatrix} \begin{bmatrix} I_{w_{k+1}} \\ 0_{w_k-w_{k+1}, w_{k+1}} \end{bmatrix} = \begin{bmatrix} I_{w_{k+1}} \\ 0_{w_{k-1}-w_{k+1}, w_{k+1}} \end{bmatrix}
\end{align}
利用上式,我们发现
\begin{align}
(W(w,\lambda) - \lambda I)^2 = \begin{bmatrix} 0_{w_1} & 0 & G_{w_1,w_3} && \\ & 0_{w_2} & 0 & \ddots & \\ && 0_{w_3} & \ddots & G_{w_{q-2},w_q} \\ &&& \ddots & 0 \\ &&&& 0_{w_q} \end{bmatrix}
\end{align}
所以 \(\mathrm{rank}(W(w,\lambda)-\lambda I)^2 = w_3 +\cdots + w\_q\). 按照此规律可推出 \(\mathrm{rank}(W(w,\lambda)-\lambda I)^p = w_{p+1} +\cdots + w\_q\)(对每个 \(p=1,2,\cdots\)). 由此推出
\begin{align}
\mathrm{rank}(W(w,\lambda)-\lambda I)^{p-1} - \mathrm{rank}(W(w,\lambda)-\lambda I)^p = w_p, \quad p=1,\cdots ,q
\end{align}
所以 \(W(w,\lambda)\) 的与特征值 \(\lambda\) 相关和 Weyr 特征就是 \(w\). 由特征值指数的定义知, 式 (\ref{e222}) 中的对角分块的个数(参数 \(q\))就是 \(\lambda\) 作为 \(W(w,\lambda)\) 的特征值的指数.
Weyr 矩阵是与不同的特征值对应的 Weyr 分块的直和.
对任意给定的 \(A \in M_n\), 设 \(q\) 是 \(A\) 的特征值 \(\lambda\) 的指数,设 \(w_k=w_k(A,\lambda)(k=1,2,\cdots)\) 是 \(A\) 的与 \(\lambda\) 相关的 Weyr 特征,并定义 \(A\) 的与特征值 \(\lambda\) 相关的 Weyr 分块是
\begin{align}
W_A(\lambda) = W(w(A,\lambda), \lambda)
\end{align}
Weyr 分块 \(W_A(\lambda)\) 的大小是 \(\lambda\) 的代数重数.
为了加深理解,计算一个例子:
\begin{align}
W_J(0) = \begin{bmatrix} 0_6 & G_{6,5} & \\ & 0_5 & G_{5,2} \\ & & 0_2 \end{bmatrix} ,\quad W_{J}(0)^2 = \begin{bmatrix} 0_6 & 0_{6,5} & G_{6,2} \\ & 0_5 & 0_{5,2} \\ & & 0_2 \end{bmatrix} ,\quad W_J(0)^3 = 0
\end{align}
显然,\(\mathrm{rank} W_{J}(0)=7=w_2+w_3\), 且 \(\mathrm{rank} W_{J}(0)^2=2=w_3\). \(W_{J}(0)\) 的与它(仅有的)特征值 \(0\) 相关的 Weyr 特征是 \((6,5,2)\).
Weyr 标准型定理
定理2(Weyr 标准型定理): 设给定 \(A\in M_n\), 又设 \(\lambda_1, \cdots, \lambda_d\) 是它的按照任意次序排列的不同的特征值. 则存在一个非奇异的 \(S \in M_n\), 且存在 Weyr 分块 \(W_1,\cdots,W_d\), 使得 (a) \(W_j\) 的(仅有的)特征值是 \(\lambda_j\) (对每个\(j=1,\cdots,d\))以及 (b) \(A=S(W_1 \oplus \cdots \oplus W_d) S^{-1}\). Weyr 矩阵(\(A\) 与之相似)\(W_1 \oplus \cdots \oplus W_d\) 由 \(A\) 以及所列举出的给定的不同的特征值唯一确定:对每个 \(j=1,\cdots,d\) 有 \(W_j=W_A(\lambda_j)\), 所以
\begin{align}
A=S \begin{bmatrix} W_A(\lambda_1) & & \\ & \ddots & \\ & & W_A(\lambda_d) \end{bmatrix} S^{-1}
\end{align}
如果 \(A\) 与一个 Weyr 矩阵相似,那么那个矩阵可以由 \(W_A = W_A(\lambda_1) \oplus \cdots \oplus W_A(\lambda_d)\) 通过它的直和项的一个排列而得到. 如果 \(A\) 是实的且仅有实的特征值,那么 \(S\) 可以选取为实的.
证明:先前的结论表明 \(W_A = W_A(\lambda_1) \oplus \cdots \oplus W_A(\lambda_d)\), 且对于它们的每一个不同的特征值,\(A\) 的与之相关的 Weyr 特征都是相同的. 由于 \(W_A\) 与 \(A\) 都是相似于相同的 Jordan 标准型,所以它们相似. 如果两个 Weyr 矩阵相似,那么它们必定有同样的不同的特征值,且对于每个特征值有相同的与之相关的 Weyr 特征;由此推出,它们有同样的 Weyr 分块,这些分块在各自的直和中有不同的排列次序. 如果 \(A\) 与它的所有的特征值都是实的,则 \(W_A\) 是实的,且 \(A\) 与 \(W_A\) 通过一个实的相似而相似.
上个定理中的 Weyr 矩阵 \(W_A\) 就是 \(A\) 的 Weyr 标准型. Weyr 与 Jordan 标准型 \(W_A\) 与 \(J_A\) 包含了 \(A\) 的同样的信息,不过各自是以不同的方式给出这些信息. Weyr 标准型以明显地方式展示了 \(A\) 的 Weyr 特征,而 Jordan 标准型以明显的方式展示了它的 Segre 特征. 此外 \(W_A\) 与 \(J_A\) 还是置换相似的.
应该学习到什么
- 实矩阵才有实的 Jordan 标准型
- 矩阵 \(A \in M_n\) 与一个实矩阵相似,等价于 \(A\) 与 \(\bar{A}\) 相似(因为它们有相同的实 Jordan 标准型)
- 对每个 \(A\in M_n\), \(A\bar{A}\) 与 \(\bar{A}A\) 相似,也与一个实矩阵相似.
- Weyr 分块 \(W(w,\lambda)\) 由 Weyr 特征 \(w\) 完全决定
- Weyr 矩阵是与不同的特征值对应的 Weyr 分块的直和
- Weyr 与 Jordan 标准型 \(W_A\) 与 \(J_A\) 包含了 \(A\) 的同样的信息,且它们是置换相似的