相似无疑是方阵间最重要的一种等价关系. 对于可对角化的矩阵,我们自然可以取相似类中的对角矩阵作为代表元或将矩阵\(A\)分解为\(A=P\Lambda P^{-1}\)(其中\(\Lambda\)为对角矩阵)来解决问题. 对于一般的矩阵,可以考虑Frobenius标准形或Joran标准形矩阵,使相关问题得以简化.

\(\S1\) Schur标准形

任一复方阵都相似于上三角矩阵,史称Schur引理或Jacobi定理,可以看作相似的某种粗略的标准形. 由于上三角矩阵的对角元素就是该矩阵的特征值,所以某些涉及矩阵特征值的相关问题可以通过Schur标准形来解决.

例1.1\(A\)为可逆实对称矩阵,\(B\)为实反对称矩阵且\(AB=BA\). 求证:\(A+B\)可逆.

证明\(A\)可逆且\(AB=BA\), 则\(A^{-1}B=BA^{-1}\). 于是

\[(BA^{-1})^T=(A^T)^{-1}B^T=A^{-1}(-B)=-BA^{-1}. \]

由于反对称实矩阵的特征值为零或纯虚数,所以存在可逆矩阵\(P\)使得

\[P^{-1}BA^{-1}P=\begin{pmatrix} \lambda_1&*&\cdots&*\\ &\lambda_2&\cdots&*\\ &&\ddots&*\\ &&&\lambda_n \end{pmatrix}, \quad \lambda_i=0\mbox{或纯虚数}. \]

所以

\[|A+B|=|(E+BA^{-1})A|=|A|\begin{vmatrix} 1+\lambda_1 &*&\cdots&*\\ &1+\lambda_2 &\cdots&*\\ &&\ddots&*\\ &&&1+\lambda_n \end{vmatrix}. \]

因为\(1+\lambda_i\ne 0\), \(i=1,2,\cdots,n\), 所以\(|A+B|\ne 0\), 从而可逆.

例1.2\(n\)阶复方阵\(A\)的特征值为\(\lambda_1, \lambda_2,\cdots, \lambda_n\), 则\(A\)的伴随矩阵\(A^*\)的特征值为\(\mu_i=\prod_{j\ne i} \lambda_j,\; i=1,2,\cdots,n\).

证明 由Schur引理知存在可逆矩阵\(P\), 使得

\[P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ &\lambda_2&\cdots&*\\ &&\ddots&\vdots\\ &&&\lambda_n \end{pmatrix}. \]

从而

\[(P^*)^{-1}A^*P^*= \begin{pmatrix} \prod_{j\ne 1}\lambda_j&*&\cdots&*\\ &\prod_{j\ne 2}\lambda_j&\cdots&*\\ &&\ddots&*\\ &&&\prod_{j\ne n}\lambda_j \end{pmatrix}, \]

\(A^*\)的特征值为\(\mu_i=\prod_{j\ne i} \lambda_j,\; i=1,2,\cdots,n\).

例1.3[厦门大学,2008]设\(V\)是复数域\(\mathbb{C}\)上的线性空间,\(\sigma\)\(V\)的线性变换,求证:存在\(\sigma\)-不变子空间\(V_0,V_1,\cdots,V_n\)使得\(V_0\subseteq V_1\subseteq \cdots\subseteq V_n\), 且\(\dim V_i=i (1\leqslant i\leqslant n)\).

证明 由Schur引理,存在\(V\)的一组基\(\xi_1,\xi_2,\cdots,\xi_n\)使得

\[\sigma(\xi_1,\xi_2,\cdots,\xi_n)=(\xi_1,\xi_2,\cdots,\xi_n) \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ &a_{22}&\cdots&a_{2n}\\ &&\ddots&\vdots\\ &&&a_{nn} \end{pmatrix} \]

\(V_0=\{0\}, V_i=\mbox{span}(\xi_1,\xi_2,\cdots,\xi_i), i=1,2,\cdots,n\), 则\(V_i\)\(\sigma\)-不变子空间,\(\dim V_i=i\), 且\(V_0\subseteq V_1\subseteq \cdots\subseteq V_n\).

\(\S2\) Jordan标准形

Jordan标准形定理与Frobenius标准形定理无疑是高等代数中最重要的定理,一个命题若对矩阵\(A\)的相似类正确,则可以取\(A\)的Jordan标准形与Frobenius标准形来解决问题. 大家应该养成使用Jordan标准形或Frobenius标准形考虑相关问题的习惯.

如果\(A\)的极小多项式

\[m_A(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots (\lambda-\lambda_s)^{r_s} \]

\(r_i=A\)的Jordan标准形中对应于特征值\(\lambda_i\)的最大Jordan块的阶数. 则有如下例题:

例2.1[华东师范大学2021]
设6阶复矩阵\(A,B\)是幂零矩阵,且有相同的秩和极小多项式,证明:\(A,B\)相似.

证明\(A,B\)的Jordan标准形分别为\(J_A,J_B\).

(1) \({\rm r}(J_A)={\rm r}(J_B)=0\), 结论显然成立;

(2) \({\rm r}J_A)={\rm r}(J_B)=1\),
\(J_A\sim J_2(0)\oplus O_{4\times 4}\sim J_B\).

(3)\({\rm r}(J_A)={\rm r}(J_B)=2\),
\(J_A,J_B\)的可能情形为

\[J_3(0)\oplus O_{3\times 3}, J_2(0)\oplus J_2(0)\oplus O_{2\times 2} \]

如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).

(4)\({\rm r}(J_A)={\rm r}(J_B)=3\),
\(J_A,J_B\)的可能情形为

\[J_4(0)\oplus O_{2\times 2}, J_2(0)\oplus J_3(0)\oplus 0, J_2(0)\oplus J_2(0)\oplus J_2(0) \]

如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).

(5)\({\rm r}(J_A)={\rm r}(J_B)=4\),
\(J_A,J_B\)的可能情形为

\[J_5(0)\oplus 0, J_2(0)\oplus J_4(0), J_3(0)\oplus J_3(0) \]

如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).

(6)\({\rm r}(J_A)={\rm r}r(J_B)=5\),
\(J_A=J_B=J_6(0)\), 所以\(A\sim B\).

练习[苏州大学2023]
\(n\)阶复方阵\(A\)是幂零矩阵(即存在正整数\(m\), 使得\(A^m=O\)), 证明:互不相似的5阶幂零阵最多有7个.
\end{exercise}

例2.2[浙江大学,2006]设3阶矩阵\(A,B,C,D\in\mathbb{C}^{3\times 3}\)具有相同的特征多项式,证明:其中必有两个矩阵相似.

证明 由题设知\(A,B,C,D\)具有相同的特征值,不妨设为\(\lambda_1,\lambda_2,\lambda_3\), 下面分为三种情况讨论:

(1) \(\lambda_1,\lambda_2,\lambda_3\)互不相等,则\(A,B,C,D\)具有Jordan标准形

\[J=\diag(\lambda_1,\lambda_2,\lambda_3) \]

所以\(A,B,C,D\)彼此相似;

(2) \(\lambda_1,\lambda_2,\lambda_3\)中仅有两个相等,不妨设\(\lambda_1=\lambda_2\), 则\(A,B,C,D\)可能的Jordan标准形为

\[J_1=\begin{pmatrix} \lambda_1&1&\\ &\lambda_1&\\ &&&\lambda_3 \end{pmatrix},\quad J_2=\begin{pmatrix} \lambda_1&&\\ &\lambda_1&\\ &&&\lambda_3 \end{pmatrix} \]

\(A,B,C,D\)中至少有两个矩阵或者相似于\(J_1\), 或者相似于\(J_2\), 因而这两个矩阵也相似;

(3) \(\lambda_1=\lambda_2=\lambda_3\), 则\(A,B,C,D\)可能的Jordan标准形为

\[J_1=\begin{pmatrix} \lambda_1&1&\\ &\lambda_1&1\\ &&&\lambda_1 \end{pmatrix},\quad J_2=\begin{pmatrix} \lambda_1&1&\\ &\lambda_1&\\ &&&\lambda_1 \end{pmatrix},\quad J_3=\begin{pmatrix} \lambda_1&&\\ &\lambda_1&\\ &&&\lambda_1 \end{pmatrix} \]

\(A,B,C,D\)中至少有两个矩阵相似于\(J_1, J_2,J_3\)中的一个, 因而这两个矩阵也相似.

例2.3\(n\)阶矩阵\(A\)的特征值全为零,求证\(A\)必为幂零矩阵.

证明\(A\)的Jordan标准形为\(J\), 即存在可逆矩阵\(P\)使得\(P^{-1}AP=J\). 则\(J\)的主对角元为\(0\). 记\(m\)\(J\)中最大Jordan块的阶数,则\(J^m=O\),从而\(A^m=PJ^mP^{-1}=O\).

例2.4[Voss分解定理] 任一复方阵 都可分解为两个对称矩阵的乘积, 其中一个是可逆矩阵.

证明存在可逆矩阵\(P\)使得\(P^{-1}AP=J=\mbox{diag}(J_1,J_2,\cdots,J_s)\), 其中\(J_i=J_{n_i}(\lambda_i)\), \(i=1,2,\cdots,s\). 令

\[N_i=\left(\begin{array}{cccc} &&&1\\ &&1&\\ &\iddots&&\\ 1&&& \end{array}\right). \]

\(N_i^{-1}=N_i^T=N_i\), 且\(N_iJ_{n_i}^T(\lambda_i)N_i=J_{n_i}(\lambda_i)\). 令
\(N=\mbox{diag}(N_1,N_2,\cdots,N_s)\), 则\(N^{-1}=N^T=N\), 且\(J=NJ^TN\).

\[\begin{array}{rl} A&=PJP^{-1}=PNJ^TNP^{-1}=PN(P^TA^T(P^{-1})^T)NP^{-1}\\ &=(PNP^T)(A^T(P^{-1})^TNP^{-1}). \end{array} \]

\(B=PNP^T\), \(C=A^T(P^{-1})^TNP^{-1}=A^TB^{-1}\), 则\(A=BC\). 由于

\[\begin{array}{l} B^T=(PNP^T)^T=PNP^T=B,\\ C^T=(A^TB^{-1})^T=B^{-1}A=B^{-1}(BC)=C. \end{array} \]

所以\(B,C\)都是对称矩阵, 且\(B\)可逆.

例2.5[华中师范大学1993] 设\(\mathscr{A}\)是数域\(\mbox{F}\)\(n\)维线性空间\(V\)上的线性变换. 证明\(V= \mbox{Im} (\mathscr{A})\oplus \mbox{Ker}(\mathscr{A})\)的充要条件是\(0\)\(\mathscr{A}\)的极小多项式的单根.

证明 先证\(V= \mbox{Im} (\mathscr{A})\oplus \mbox{Ker}(\mathscr{A})\Longleftrightarrow\) \({\rm r}(\A^2)={\rm r}(\mathscr{A})\).

充分性:由维数公式

\[\dim\mbox{Im}\mathscr{A}+\dim\mbox{Ker}\mathscr{A}=n,\quad \dim\mbox{Im}\mathscr{A}^2+\dim\mbox{Ker}\mathscr{A}^2=n, \]

\(\dim\mbox{Im}\mathscr{A}={\rm r}(\mathscr{A})\), 故\(\dim\mbox{Im}\mathscr{A}=\dim\mbox{Im}\mathscr{A}^2\), 从而
\(\dim\mbox{Ker}\mathscr{A}=\dim\mbox{Ker}\mathscr{A}^2\). 由于\(\mbox{Ker}\mathscr{A}\subseteq \mbox{Ker}\mathscr{A}^2\), 所以\(\mbox{Ker}\mathscr{A}=\mbox{Ker}r\mathscr{A}^2\).

\(\forall \alpha\in\mbox{Im}\mathscr{A}\cap\mbox{Ker}\mathscr{A}\), 则\(\alpha=\mathscr{A}\xi\), \(\xi\in V\); 而且\(\mathscr{A}\alpha=0\). 所以\(\mathscr{A}^2\xi=\mathscr{A}\alpha=0\), 即\(\xi\in\mbox{Ker}\mathscr{A}^2=\mbox{Ker}\mathscr{A}\). 从而\(\alpha=\mathscr{A}\xi=0\). 即\(\mbox{Im}\mathscr{A}\cap\mbox{Ker}\mathscr{A}=0\). 又\(\dim\mbox{Im}\mathscr{A}+\dim\mbox{Ker}\mathscr{A}=n\), 所以\(V=\mbox{Im}\mathscr{A}\oplus\mbox{Ker}\mathscr{A}\).

必要性:\(\forall \alpha\in\mbox{Im}\mathscr{A}\), \(\exists \beta\in V\), s.t. \(\mathscr{A}\beta=\alpha\). 又因为\(V=\mbox{Im}\mathscr{A}\oplus\mbox{Ker}\mathscr{A}\), 所以可设
\(\beta=\mathscr{A}\beta_1+\beta_2\), \(\beta_1\in V,\beta_2\in \mbox{Ker}\mathscr{A}\). 故

\[\alpha=\mathscr{A}\beta=\mathscr{A}(\mathscr{A}\beta_1+\beta_2)=\mathscr{A}^2\beta_1\in\mbox{Im}\mathscr{A}^2. \]

\(\mbox{Im}\mathscr{A}\subseteq \mbox{Im}\mathscr{A}^2\);又\(\mbox{Im}\mathscr{A}^2\subseteq \mbox{Im}\mathscr{A}\), 所以\(\mbox{Im}\mathscr{A}=\mbox{Im}\mathscr{A}^2\), 从而\({\rm r}(\mathscr{A})={\rm r}(\mathscr{A}^2)\).

\({\rm r}(\mathscr{A})={\rm r}(\mathscr{A}^2)\). \(\Longleftrightarrow\) \(\mathscr{A}\)的Jordan 标准形中特征值为\(0\)的Jordan块是\(1\)阶的\(\Longleftrightarrow\) \(0\)\(\mathscr{A}\)的极小多项式的单根.

例2.6\(\lambda_0\)\(n\)阶复矩阵\(A\)\(k\)重特征值,则\(\r(\lambda_0E-A)^k=n-k\).

证明 设存在可逆矩阵\(P\)使得\(P^{-1}AP=J\)\(A\)的Jordan标准形,则

\[P^{-1}(\lambda_0E-A)^kP=(\lambda_0E-P^{-1}AP)^k=(\lambda_0E-J)^k. \]

因此只需证明\(\r(\lambda_0E-J)^k=n-k.\)

\(J_1=J_s(\lambda_0)\)是对应于特征值\(\lambda_0\)的Jordan块,则\(s\leqslant k\), 从而\((\lambda_0E-J_1)^k=O\). 由此知\(J\)中对应于特征值\(\lambda_0\)的任意Jordan块的\(J_i\), \((\lambda_0E-J_i)^k=O\). 而对其它的Jordan块\(J_t\), \((\lambda_0E-J_t)^k\)可逆,所以\(\r(\lambda_0E-J)^k=n-k\).

例2.7[东南大学2004] 设\(A\)\(n\)阶方阵,求证:存在正整数\(k\)使得\(\r(A^k)=\r(A^{k+1})\), 并证存在\(n\)阶方阵\(B\)使得\(A^k=A^{k+1}B\).

证明 (1) 若\(0\)不是\(A\)的特征值,则\(A\)可逆,结论显然成立.

(2) 设\(0\)\(A\)的特征值,存在可逆矩阵\(P\)使得\(P^{-1}AP=J=\mbox{diag}(J_0,J_1)\), 其中\(J_0,J_1\)分别是由零特征值与非零特征值对应的Jordan块构成的子块. 设\(J_0\)中最大Jordan快的阶数是\(k\), 则\(J_0^k=O\), 从而
\(P^{_1}A^kP=J^k=\mbox{diag}(O,J_i^k)\). 故

\[\r(A^k)={\rm r}(J^k)={\rm r}(J_i^k)={\rm r}(J_1^{k+1})={\rm r}(A^{k+1}). \]

进一步地,取\(B=P\begin{pmatrix} O&\\ &J_1^{-1} \end{pmatrix}\)即满足要求.

回顾一下,设\(\lambda\)\(n\)阶矩阵\(A\)的任一特征值,

\[V^{\lambda}=\{x\in\mbox{F}^n\mid (\lambda E-A)^nx=0 \} \]

是对应于特征值\(\lambda\)的广义特征子空间.

例2.8 对于特征值\(\lambda_i\), \(i=1,2,\cdots,s\),

(1) \(\dim V^{\lambda_i}=\lambda_i\)的代数重数=对应于特征值\(\lambda_i\)的Jordan块阶数之和;

(2) (中国科学院2011) \(\dim V_{\lambda_i}=\lambda_i\)的几何重数=对应于特征值\(\lambda_i\)的Jordan块的数目.

证明 设矩阵\(A\)相似于Jordan形矩阵\(J=\mbox{diag}(J(\lambda_1),J(\lambda_2),\cdots, J(\lambda_s))\), 其中

\[J(\lambda_j)=\mbox{diag}(J_{e_{nj}}(\lambda_j),J_{e_{n-1,j}}(\lambda_j), \cdots,J_{e_{k_jj}}(\lambda_j)). \]

(1) 由于$$(J-\lambda_i E){n_i}=\left(\begin{smallmatrix}J(\lambda_1-\lambda_i)&&&&&&\
&\ddots&&&&&\ &&J(\lambda_{i-1}-\lambda_i)^{n_i}&&&&\ &&&O&&&\
&&&&J(\lambda_{i+1}-\lambda_i)^{n_i}&&\ &&&&&\ddots&\
&&&&&&J(\lambda_s-\lambda_i)^{n_i}\end{smallmatrix}\right),$$ 由于当\(j\ne i\)时, \(\lambda_j-\lambda_i\ne 0\), 故下三角矩阵的方幂
\(J(\lambda_j-\lambda_i)^{n_i}\)满秩. 所以
\(\dim V^{\lambda_i}=n-\r\big({J-\lambda_iE}\big)^{n_i}=n_i.\)

(2) 注意到\(\r(J-\lambda_i E)=n-\)对应于特征值\(\lambda_i\)的Jordan块的数目, 所以
\(\dim V_{\lambda_i}=n-\r(A-\lambda_i E) =\)对应于特征值\(\lambda_i\) 的Jordan块的数目.

练习[中国科学院2006,\(n=2006\)] 设\(A\in\mathbb{R}^{n\times n}\)是给定的幂零矩阵,试分析
线性方程组\(Ax=0\)非零独立解个数的最大值与最小值.

例2.9\(A\)是复数域上的\(n\)阶方阵, 则\(A\)可对角化当且仅当\(\forall \lambda\in\mathbb{C}\), \(\r(\lambda E-A)=\r(\lambda E-A)^2\).

证明 必要性显然, 下证充分性.

由Jordan标准形定理知\(A\)相似于Jordan形矩阵\(J\). 若存在Jordan块\(J_k(\lambda)\) 使得\(k>1\), 则\(\r(\lambda E_k-J)>\r(\lambda E_k-J)^2\), 从而\(\r(\lambda E-A)>\r(\lambda E-A)^2\), 矛盾. 故\(J\)中的Jordan块都是一阶的, 即\(J\)为对角矩阵.

利用Jordan标准形可得到矩阵的两种分解,一是将矩阵分解为对角部分(可对角化部分)与幂零部分之和,即Chevalley分解;另一是分解成特征值为0的Jordan块与特征值非零的Jordan块的直和.

例2.10[2011第三届大数竞赛预赛] 设\(A\)是数域\(\mF\)上的\(n\)阶不可逆方阵, 而且\(A\)不是幂零矩阵,证明:\(A\sim \left(\begin{array}{cc} B&O\\ O&C \end{array}\right)\), 其中\(B\)是幂零矩阵, \(C\)是可逆矩阵.

证明\(A\)的Jordan标准形为

\[J=\mbox{diag}(J(\lambda_1,e_1), J(\lambda_2,e_2),\cdots,J(\lambda_k,e_k)). \]

因为\(A\)不可逆,所以存在零特征值. 又因为\(A\)不是幂零矩阵,所以也存在非零特征值.
不妨设\(\lambda_i=0(i=1,2,\cdots,s), \lambda_J\ne 0(j=s+1,s+2,\cdots,k)\). 令

\[B=\mbox{diag}(J(0,e_1), J(0,e_2),\cdots,J(0,e_s)) \]

为幂零矩阵,

\[C=\mbox{diag}(J(\lambda_{s+1},e_{s+1}), J(\lambda_{s+2},e_{s+2}),\cdots,J(\lambda_k,e_k)) \]

为可逆矩阵,且\(J=\begin{pmatrix}B&O\\ O&C\end{pmatrix}\).

例2.11\(n\)阶复矩阵\(A,B\)满足\(AB=BA=O, {\rm r}(A)={\rm r}(A^2)\), 则\({\rm r}(A+B)={\rm r}(A)+{\rm r}(B)\).

证明 因为\({\rm r}(A)={\rm r}(A^2)\), 所以, 类似于上题的分析, 特征值为\(0\)的Jordan块都是一阶的, 于是由Jordan标准形, 存在可逆矩阵\(P\), 使得

\[P^{-1}AP=\left(\begin{array}{cc} C_{r\times r}&O\\ O&O \end{array}\right)=A_1, \; \r(A)=\r(C). \]

由于\(AB=BA=O\), 设\(P^{-1}BP=B_1\), 则\(A_1B_1=B_1A_1=O\), 于是
\(B_1\)形如

\[B_1=\left(\begin{array}{cc} O&O\\ O&D_{(n-r)\times(n-r)} \end{array}\right). \]

\({\rm r}(B)={\rm r}(B_1)={\rm r}(D)\), 故

\[\begin{array}{rl} {\rm r}(A+B)=&{\rm r} P^{-1}(A+B)P={\rm r}(A_1+B_1) ={\rm r}\left(\begin{array}{cc} C_{r\times r}&O\\ O&D_{(n-r)\times(n-r)} \end{array}\right)\\ =&{\rm r}(C)+\r(D)={\rm r}(A)+{\rm r}(B). \end{array} \]

例2.12\(A\)是复数域上的\(n\)阶方阵, 则\(A\)\(A^T\)相似.

证明 证法一:由Jordan标准形定理, 设\(A\sim \oplus_{i=1}^kJ_{n_i}(\lambda_i)\). 令

\[N_i=\left(\begin{array}{cccc} &&&1\\ &&1&\\ &\iddots&&\\ 1&&& \end{array}\right), \]

\(N_i^{-1}J_{n_i}(\lambda_i)N_i=J_{n_i}(\lambda_i)^T\), 所以令\(N=\oplus_{i=1}^kN_i\), 则\(N^{-1}AN=A^T\).

证法二:显然\(A\)\(A^T\)有相同的行列式因子, 因而它们相似.

例2.13\(A\)\(n\)阶复方阵,设\(\lambda_i\)\(A\)的任一特征值, \(A\)的Jordan标准形中仅有一个对应的Jordan 块,当且仅当\(\lambda_i\)的几何重数\(\dim V_{\lambda_i}=1\).

证明 必要性:由于\(A\sim J\), 它们有相同的特征值, 且每个特征值的几何重数(即对应特征子空间的维数)相同. 所以我们只需考虑\(A\)的Jordan标准形\(J\). 为方便, 我们不妨考虑特征值\(\lambda_1\). 很清楚, \(J\varepsilon_{n_1}=\lambda_1\varepsilon_{n_1}\), 所以\(\varepsilon_{n_1}\)\(J\)的一个属于\(\lambda_1\) 的非零特征向量. 又因为

\[\r(\lambda_1 E_{n_j}-J_{n_j}(\lambda_j))=\left\{ \begin{array}{ll} n_1-1, & \mbox{若}j=1;\\ n_j, & \mbox{若}j\ne 1. \end{array}\right. \]

所以\(\r(\lambda_1 E-J)=n-1\). 故\(\dim V_{\lambda_1}=1\).
类似地, \(\dim V_{\lambda_i}=1\), \(i=1,2,\cdots,s\).

充分性: 由于特征值\(\lambda_i\)的几何重数等于\(J\)
属于\(\lambda_i\)的Jordan块的个数, 所以\(\dim V_{\lambda_i}=1\) 暗示着Jordan标准形\(J\)中仅有一个对应于\(\lambda_i\)的Jordan 块.

利用Jordan标准形解决相关问题,其一般转化路线为:

一般\(n\)阶矩阵\(\rightarrow\)Jordan形矩阵\(\rightarrow J_n(\lambda)\rightarrow J_n(0)\).

\(A\)是数域\(F\)上的\(n\)阶方阵,

\[\mathcal{C}(A)=\{B\in \mbox{F}^{n\times n}\mid AB=BA\}, \]

称为\(A\)的中心化子.

例2.14
对任意的\(n\)阶复方阵,\(\dim \mathcal{C}(A)\geqslant n\).

证明
取可逆矩阵\(P\)使得\(P^{-1}AP=J\)为Jordan标准形,定义线性同构

\[\sigma_P: \mathbb{C}^{n\times n}\rightarrow \mathbb{C}^{n\times n},\quad B\mapsto P^{-1}BP. \]

则容易验证\(\mathcal{C}(J)=\sigma_P(\mathcal{C}(A)\), 因而\(\dim\mathcal{C}(A)=\dim\mathcal{C}(J)\). 所以不妨设\(A\)本身是Jordan标准形矩阵

\[A=\mbox{diag}(J_1,J_2,\cdots,J_s), \]

其中
\(J_i=J(\lambda_i)\)是对应于特征值\(\lambda_i\)的Jordan形矩阵,且\(\lambda_i\)互异, \(1\leqslant i\leqslant s.\)
所以

\[\mathcal{C}(A)=\{\mbox{diag}(B_1,B_2,\cdots,B_s)\mid J_iB_j=B_iJ_i,1\leqslant i\leqslant s\}. \]

\(J_i=\lambda_iE_{n_i}+J(i,0), \; J(i,0)=\oplus_k J_{n_{i_k}}(0)\), 则

\[J_iB_j=B_iJ_i\Leftrightarrow J(i,0)B_i=B_iJ(i,0). \]

因为\(\dim\mathcal{C}(J(i,0))=\dim\mathcal{C}(\oplus_k J_{n_{i_k}}(0))\geqslant \sum_k\dim\mathcal{C}(J_{n_{i_k}}(0)))=n_i\), 所以

\[\dim\mathcal{C}(A)\geqslant n_1+n_2+\cdots+n_s=n. \]

例2,15\(\sigma\)是复数域上\(n\)维线性空间\(V\)上的线性变换,则\(\sigma\)可对角化当且仅当对于\(\sigma\)的任意特征值\(\lambda\), 都有\(\mbox{Im}(\sigma-\lambda \mbox{id}_V)\cap\mbox{Ker}(\sigma-\lambda \mbox{id}_V)=0\).

证明 充分性:(反证法)假设\(\sigma\)不可对角化,则存在\(V\)的一组基使得\(\sigma\)在该基下的Jordan形矩阵\(J\)有一个大于\(1\)阶的Jordan块,不妨设为
\(J_s(\lambda_1), s>1\). 由于

\[(\sigma-\lambda_1 \mbox{id}_V)e_{s-1}=e_s, (\sigma-\lambda_1 \mbox{id}_V)e_s=0, \]

所以

\[e_s\in\Im(\sigma-\lambda_1 \mbox{id}_V)\cap\mbox{Ker}(\sigma-\lambda_1 \mbox{id}_V), \]

矛盾!故\(\sigma\)可对角化.

必要性:若\(\sigma\)可对角化,设存在\(V\)的一组基使得\(\sigma\)在该基下的矩阵为

\[\Lambda=\begin{pmatrix} \lambda_1 E_{n_1}&&&\\ &\lambda_2 E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_s E_{n_s} \end{pmatrix}, \]

其中\(\lambda_1,\lambda_2,\cdots,\lambda_s\)两两不同. 则对任意的特征值\(\lambda_i\),

\[\begin{array}{l} \mbox{Im}(\sigma-\lambda_i \mbox{id}_V)\cong \mbox{Col} (\Lambda-\lambda_i E_n)=\mbox{span}(e_1,\cdots,e_{\sum_{k=1}^{i-1}n_k}, e_{\sum_{k=1}^in_k+1},\cdots, e_n), \\ \mbox{Ker}(\sigma-\lambda_i \mbox{id}_V)\cong \mbox{span}( e_{\sum_{k=1}^{i-1}n_k+1}), e_{\sum_{k=1}^in_k+1}. \end{array} \]

所以
\(\mbox{Im}(\sigma-\lambda_i \mbox{id}_V)\cap\mbox{Ker}(\sigma-\lambda_i \mbox{id}_V)=0\).

例2.16\(A,B\in\mathbb{C}^{n\times n}\), \(C=AB-BA\)\(AC=CA\), 则\(C\)是幂零矩阵.

证明 设存在可逆矩阵\(P\)使得

\[\bar{C}=P^{-1}CP=\begin{pmatrix} C_1&&&\\ &C_2&&\\ &&\ddots&\\ &&&C_s \end{pmatrix}, \]

其中\(C_i=J_{n_i}(\lambda_i)\)是由对应于特征值\(\lambda_i\)的Jordan块组成的分块对角矩阵(\(i=1,2,\cdots,s\)). 记\(\bar{A}=P^{-1}AP\). 由于\(AC=CA\), 则\(\bar{A}\bar{C}=\bar{C}\bar{A}\). 由于\(C_i\)具有不同的特征值,所以

\[\bar{A}=\begin{pmatrix} A_1&&&\\ &A_2&&\\ &&\ddots&\\ &&&A_s \end{pmatrix}. \]

按照\(\bar{A}\)的分块方法,将\(\bar{B}=P^{-1}BP\)进行分块

\[\bar{B}=\begin{pmatrix} B_{11}&B_{12}&\cdots&B_{1s}\\ B_{21}&B_{22} &\cdots&B_{2s}\\ \vdots&\vdots&&\vdots\\ B_{s1}&B_{s2}&\cdots&B_{ss} \end{pmatrix}. \]

则由\(C=AB-BA\)可得

\[C_i=A_iB_{ii}-B_{ii}A_i,\; i=1,2,\cdots,s. \]

\(Tr(C_i)=0\), \(i=1,2,\cdots,s.\) 由于\(C_i\)是上三角矩阵,对角元是特征值\(\lambda_i\), 所以\(\lambda_i=0\),\(i=1,2,\cdots,s.\)\(\bar{C}\)是幂零矩阵,从而\(C\)是幂零矩阵.

例2.17[上海交通大学2018,华东师范大学2002] 设\(A,B\)\(n\)阶方阵,\(\r(A)=n-1\), \(B\ne O\)满足\(AB=BA=O\). 求证:存在多项式\(g(x)\)使得\(B=g(A)\).

证明
设存在可逆矩阵\(P\)使得\(P^{-1}AP=J\)为Jordan标准形,由于\(AB=BA=O\)

\[J(P^{-1}BP)=(P^{-1}BP)J=O \]

由于\(\r(J)=\r(A)=n-1\), 所以\(J\)可能为以下三种情形:

(1) \(J=\begin{pmatrix} 0&\\ &J_1\end{pmatrix}\), 其中\(J_1\)是非零特征值对应的\(n-1\)阶Jordan形矩阵. 对\(P^{-1}BP\)进行相应的分块代入上面的式子可得
\(P^{-1}BP=\begin{pmatrix} b&\\ &O\end{pmatrix}, b\ne 0\). 由于
\(B=g(A)\)当且仅当

\[P^{-1}g(A)P=g(P^{-1}AP)=g(J)=\begin{pmatrix} g(0)&\\ &g(J_1)\end{pmatrix}=\begin{pmatrix} b&\\ &O\end{pmatrix}=P^{-1}BP \]

这等价于\(g(0)=b\)\(g(J_1)=O\), 即\(g(x)\)\(J_1\)的常数项等于\(b\)的零化多项式. 由于\(J_1\)可逆,所以\(J_1\)的极小多项式的常数项\(a_0\ne 0\). 令\(g(x)=\frac{b}{a_0}m_A(x)\), 则有\(B=g(A)\).

(2) \(J=J_n(0)\). 则由\ref{Con-4.5.30}知存在常数\(b\ne 0\)使得

\[P^{-1}BP=\begin{pmatrix} 0&\cdots&0&b\\ 0&\cdots&0&0\\ \vdots&&\vdots&\vdots\\ 0&\cdots&0&0 \end{pmatrix} \]

因此\(P^{-1}BP=bJ^{n-1}=b(P^{_1}AP)^{n-1}=P^{_1}(bA^{n-1})P\). 令\(g(x_=bx^{-1}\), 则\(B=g(A)\).

(3) \(J=\begin{pmatrix} J_0&\\ &J_1\end{pmatrix}\), 其中, \(J_0=J_r(0)\), \(J_1\)是非零特征值对应的\(n-r\)阶Jordan形矩阵.
\(P^{-1}BP\)进行相应的分块代入\ref{Con-4.5.30}可得
\(P^{-1}BP=\begin{pmatrix} B_0&\\ &O\end{pmatrix}\), 其中

\[B_0=\begin{pmatrix} 0&\cdots&0&b\\ 0&\cdots&0&0\\ \vdots&&\vdots&\vdots\\ 0&\cdots&0&0 \end{pmatrix}_{r\times r}, b\ne 0. \]

显然\(B_0=bJ_0^{r-1}\). 由于
\(B=g(A)\)当且仅当

\[P^{-1}g(A)P=g(P^{-1}AP)=g(J)=\begin{pmatrix} g(J_0)&\\ &g(J_1)\end{pmatrix}=\begin{pmatrix} B_0&\\ &O\end{pmatrix}=P^{-1}BP \]

这等价于\(g(J_0)=B_0\)\(g(J_1)=O\). 即\(g(x)\)\(J_1\)的零化多项式且\(g(J_))=bJ_0^{r-1}\).

由于当\(k\geqslant r\)时,\(J_0^k=O\). 令\(g(x)=\frac{b}{a_0}x^{r-1}m_{J_1}(x)\), 其中\(m_{J_1}(x)\)\(J_1\)的极小多项式,其常数项为\(a_0\). 则\(g(J_0)=B_0\), 从而\(B=g(A)\).

\(\S3\) Frobenius标准形

定理3.1[Frobenius定理] 设\(A\)是数域\(\mbox{F}\)上的\(n\)阶方阵,\(f_A(\lambda), m_A(\lambda)\)分别是\(A\)的特征多项式与极小多项式,则

(1) \(m_A(\lambda)=d_n(\lambda)\left(=\frac{f_A(\lambda)}{D_{n-1}(\lambda)}\right)\), 即\(A\)的极小多项式是\(A\)的最后一个不变因子;

(2) \(f_A(\lambda)\)在数域\(\mbox{F}\)上的不可约因式都是\(m_A(\lambda)\)的因式.

证明 (1) 设

\[A\sim C=\begin{pmatrix} C_1&&&\\ &C_2&&\\ &&\ddots&\\ &&&C_s \end{pmatrix},\; C_i=C(d_i(\lambda)) \mbox{是Frobenius块}. \]

由于相似矩阵具有相同的极小多项式,所以

\[m_A(\lambda)=m_C(\lambda)=lcm[m_1(\lambda),m_2(\lambda),\cdots,m_s(\lambda)], \]

其中\(m_i(\lambda)\)\(C_i\)的极小多项式,\(i=1,2,\cdots,s\).

由\ref{MinPoly-FroBlock}知\(m_i(\lambda)=d_i(\lambda)\), 且\(d_i(\lambda)\mid d_{i+1}(\lambda)\), 所以\(m_A(\lambda)=d_n(\lambda)\).

(2) 设\(f_A(\lambda)\)\(\mbox{F}\)上的典型分解式为

\[f_A(\lambda)=p_1(\lambda)^{r_1}p_2(\lambda)^{r_2}\cdots p_s(\lambda)^{r_s}. \]

由于\(f_A(\lambda)=d_1(\lambda)d_2(\lambda)\cdots d_s(\lambda)\), 所以

\[p_1(\lambda)^{r_1}p_2(\lambda)^{r_2}\cdots p_s(\lambda)^{r_s}\mid d_1(\lambda)d_2(\lambda)\cdots d_s(\lambda), \]

由于\(p_1(\lambda)\)不可约,所以存在\(i\), 使得\(p_1(\lambda)\mid d_i(\lambda)\). 由于

\[d_i(\lambda)\mid d_{i+1}(\lambda),\; i=1,2,\cdots,s-1, \]

所以\(p_1(\lambda)\mid d_n(\lambda)=m_A(\lambda)\). 类似地,\(p_i(\lambda)\mid m_A(\lambda)\), \(i=2,3,\cdots,s\).

例3.1[首都师范大学,2012]设\(V\)为有理数域上的线性空间,\(\varphi\)\(V\)上的非零线性变换,且\(\varphi^4=4\varphi^2-2\varphi\). 证明: \(V=\mbox{Im}(\varphi)\oplus \mbox{Ker}(\varphi)\), 且\(\varphi\)有一个3维\(\varphi\)-不变子空间.

证明 任取\(\alpha\in \mbox{Im}(\varphi)\cap \mbox{Ker}(\varphi)\), 则\(\varphi(\alpha)=0\), 且存在\(\beta\in V\)使得\(\varphi(\beta)=\alpha\), 从而

\[2\alpha=2\varphi(\beta)=4\varphi^2(\beta)-\varphi^4(\beta)=0 \]

\(\alpha=0\), 即\(\mbox{Im}(\varphi)\cap \mbox{Ker}(\varphi)=0\). 由秩-零度定理得

\[\dim V=\dim\mbox{Im}(\varphi)+\dim \mbox{Ker}(\varphi)=\dim (\mbox{Im}(\varphi) +\mbox{Ker}(\varphi)) \]

\(V=\mbox{Im}(\varphi)\oplus \mbox{Ker}(\varphi)\).

由于\(f(\lambda)=\lambda(\lambda^3-4\lambda+2)\)\(\varphi\)的一个零化多项式,所以\(\varphi\)的极小多项式\(m(\lambda)\mid f(\lambda)\). 由\(\lambda^3-4\lambda+2\)在有理数域上不可约,故\(m(\lambda)=\lambda^3-4\lambda+2\)\(\lambda(\lambda^3-4\lambda+2)\).

\(m(\lambda)= \lambda^3 -4\lambda+2\),对应的Frobenius块为\(C=\begin{pmatrix} 0&0&-2\\ 1&0&4\\ 0&1&0\end{pmatrix}\). 则存在\(V\)的线性无关的向量\(\alpha_1,\alpha_2,\alpha_3\), 使得

\[\varphi(\alpha_1,\alpha_2,\alpha_3)=(\alpha_1,\alpha_2,\alpha_3)C. \]

\(W=\mbox{span}(\alpha_1,\alpha_2,\alpha_3)\), 则\(W\)是一个3维\(\varphi\)-不变子空间.

\(m(\lambda)= \lambda(\lambda^3 -4\lambda+2)\),对应的Frobenius块为\(C=\begin{pmatrix} 0&0&0&0\\ 1&0&0&-2\\ 0&1&0&4\\ 0&0&1&0\end{pmatrix}\). 则存在\(V\)的线性无关的向量\(\alpha_1,\alpha_2,\alpha_3,\alpha_4\), 使得

\[\varphi(\alpha_1,\alpha_2,\alpha_3,\alpha_4)=(\alpha_1,\alpha_2,\alpha_3,\alpha_4)C. \]

\(W=\mbox{span}(\alpha_2,\alpha_3,\alpha_4)\), 则\(W\)是一个3维\(\varphi\)-不变子空间.

例3.2\(A\)的Frobenius标准形是一个Frobenius块,则\(A\)有一个\(n\)阶循环向量, 即存在\(v\in V\), 使得\(v, Av, \cdots, A^{n-1}v\)线性无关.

证明 设存在可逆矩阵\(P\)使得\(P^{-1}AP=C\). 由Frobenius块的定义得

\[Ce_1=e_2, C^2e_1=e_3, \cdots, C^{n-1}e_1=e_n. \]

所以\(e_1,Ce_1,\cdots,C^{n-1}e_1\) 线性无关. 令\(v=Pe_1\), 则\(v, Av, \cdots, A^{n-1}v\) 线性无关.

例3.3 设数域\(\mbox{F}\)上的\(n\)阶矩阵\(A\)的不变因子为

\[1,1,\cdots, 1, f_A(\lambda)=|\lambda E-A|. \]

\(n\)阶矩阵\(B\)满足\(AB=BA\), 则存在\(n-1\)次多项式\(g(x)\in F[x]\)使得\(B=g(A)\).

证明 由题设知存在可逆阵\(P\)使得\(P^{-1}AP=C\)为Frobenius块. 记\(P^{-1}BP=B_1\), 则由\(AB=BA\)\(CB_1=B_1C\). 由于\(C^{i-1}e_1=e_i\), \(i=2,3,\cdots,n\), 所以

\[\begin{array}{rl}B_1&=B_1E=B_1(e_1,e_2,\cdots,e_n)=B_1(e_1, Ce_1,\cdots,C^{n-1}e_1)\\ &=(B_1e_1, B_1Ce_1,\cdots,B_1C^{n-1}e_1) \\ &=(B_1e_1, CB_1e_1,\cdots,C^{n-1}B_1e_1). \end{array} \]

\(B_1e_1=(b_1,b_2,\cdots,b_n)^T\), 则\(B_1e_1=\sum_{i=1}^nb_ie_i\). 于是上式变为

\[\begin{array}{rl} B_1=&\left(\sum_{i=1}^nb_ie_i, C\Big(\sum_{i=1}^nb_ie_i\Big), \cdots, C^{n-1}\Big(\sum_{i=1}^nb_ie_i\Big)\right)\\ =&\sum_{i=1}^nb_i\left(e_i, Ce_i, \cdots, C^{n-1}e_i\right)\\ \xlongequal{e_i=C^{i-1}e_1}& \sum_{i=1}^nb_i\left(C^{i-1}e_1, CC^{i-1}e_1, \cdots, C^{n-1}C^{i-1}e_1\right) \\ =&\sum_{i=1}^nb_iC^{i-1}\left(e_1, Ce_1, \cdots, C^{n-1}e_1\right) \\ =&\sum_{i=1}^nb_iC^{i-1}(e_1,e_2,\cdots,e_n)\\ =&\sum_{i=1}^nb_iC^{i-1}:=g(C), \end{array} \]

其中, \(g(x)=\sum_{i=1}^nb_ix^{i-1}\). 所以

\[B=PB_1P^{-1}=Pg(C)P^{-1}=g(PCP^{-1})=g(A). \]

练习(清华大学,2000) 试证明:若方阵\(A\)相似于某个多项式的友阵,则与\(A\)可交换的矩阵只能是\(A\)的多项式.

例3.4 矩阵\(C\)是换位子的充要条件是\(Tr(C)=0\).

证明 必要性:如果矩阵\(C\)是换位子, 即存在矩阵\(A,B\), 使得\(C=AB-BA\), 则\(Tr(C)=Tr(AB-BA)=Tr(AB)-Tr(BA)=0\).

充分性:我们首先证明, 如果\(Tr(C)=0\), 则\(C\)必相似于对角线全为零的矩阵.
\(C\)的阶数\(n\)用数学归纳法, \(n=1\)时显然成立. 假设该结论对小于\(n\)的矩阵成立. 考虑\(n\)阶矩阵\(C\), 设\(\Gamma\)为Frobenius 标准形. 如果\(\Gamma\)中的Frobenius 块都是一阶的, 则\(C\)的不变因子必为

\[\lambda-c,\lambda-c,\cdots,\lambda-c. \]

\(\Gamma=c E_n\). 由\(Tr(C)=0\)\(c=0\), 所以\(C=O\). 故若\(C\ne 0\), 则\(\Gamma\)中必有一个阶大于1的Frobenius 块. 因此存在可逆矩阵\(P\)使得

\[P^{-1}CP=\left(\begin{array}{cc} 0&*\\ *&C_1 \end{array}\right). \]

\(Tr(C)=0\)\(Tr(C_1)=0\). 故由归纳假设知存在\(n-1\)阶可逆矩阵\(Q\)使得
\(Q^{-1}C_1Q\)的对角线全为零. 令
\(R=P\left(\begin{array}{cc} 1&\\ &Q \end{array}\right)\), 则\(R^{-1}CR\)的主对角元全为零.

不失一般性, 我们可以假设\(C=(c_{ij})\)的主对角元全为零. 设

\[A=\mbox{diag}(a_1,a_2,\cdots,a_n), a_i\ne a_j(i\ne j);B=(b_{ij}). \]

则由\(AB-BA=C\)可得

\[a_ib_{ij}-b_{ij}a_j=c_{ij}, i\ne j, \]

\[b_{ij}=\frac{c_{ij}}{a_i-a_j}. \]

所以满足\(C=AB-BA\)的矩阵\(A,B\)存在, 即\(C\)是矩阵换位子.

\(\S4\) 实(反)对称矩阵的相似对角化

例4.1 [2 16第七届大数竞赛] 设\(A,B\)\(n\)阶实对称矩阵, 则\(Tr((AB)^2)\leqslant Tr(A^2B^2)\).

证明 因为\(A\)是实对称矩阵, 所以存在正交矩阵\(P\)使得

\[P^{-1}AP=\bar{A}=\mbox{diag}(a_1,a_2,\cdots,a_n). \]

\(\bar{B}=P^{-1}BP=(b_{ij})\)仍为实对称矩阵, 且

\[Tr((AB)^2)=Tr((\bar{A}\bar{B})^2),\; Tr(A^2B^2)=Tr(\bar{A}^2\bar{B}^2). \]

所以

\[\begin{array}{rl} Tr((\bar{A}\bar{B})^2)=&\sum_{i=1}^n\sum_{j=1}^na_ib_{ij}\cdot a_jb_{ji}\\ =&\sum_{1\leqslant i<j\leqslant n} 2a_ia_jb_{ij}^2+\sum_{i=1}^na_i^2b_{ii}^2;\\ Tr(\bar{A}^2\bar{B}^2)=&\sum_{i,j=1}^na_i^2b_{ij}^2\\ =&\sum_{1\leqslant i<j\leqslant n} (a_i^2+a_j^2)b_{ij}^2+\sum_{i=1}^na_i^2b_{ii}^2. \end{array} \]

所以

\[ Tr((\bar{A}\bar{B})^2)- Tr(\bar{A}^2\bar{B}^2) =-\sum_{1\leqslant i<j\leqslant n} (a_i-a_j)^2b_{ij}^2\leqslant 0. \]

\(Tr((AB)^2)\leqslant Tr(A^2B^2)\).

例4.2\(\lambda_1\)是实对称矩阵\(A\)\(r\)重特征值,其余特征值为\(\lambda_{r+1},\lambda_{r+2},\) \(\cdots,\lambda_n\). 令\(C=\prod_{j=r+1}^n(\lambda_jE-A)\), 则对应于\(\lambda_1\)的特征子空间\(V_{\lambda_1}\)等于\(C\)的列空间\(\mbox{col}(C)\).

证明 因为\(A\)是实对称矩阵,所以存在可逆矩阵\(P\)使得\( A=P\Lambda P^{-1}\), 其中

\[\Lambda= \begin{pmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n \end{pmatrix}. \]

所以\(C=\prod_{j=r+1}^n(\lambda_j-\lambda_1) P\begin{pmatrix} E_r&O\\ O&O \end{pmatrix}P^{-1}\), 且\(\r(C)=r\). 令\(a=\prod_{j=r+1}^n(\lambda_j-\lambda_1)\), 则

\[AC=P\Lambda P^{-1} a P\begin{pmatrix} E_r&O\\ O&O \end{pmatrix}P^{-1} =\lambda_1 C. \]

所以\(C\)的列向量都是属于特征值\(\lambda_1\)的特征向量,而\(\r(C)=r\), 从而\(C\)\(r\)个线性无关的列向量,故\(V_{\lambda_1}=\mbox{col}(C)\).

例4.3\(A\)\(n\)阶实正定对称矩阵, \(S\)为实反对称矩阵. 证明

\[|A+S|\geqslant |A| \]

且等号成立当且仅当\(S=O\).

证明因为\(A\)是正定矩阵, 所以存在可逆矩阵\(P\), 使得\(P^TAP=E_n\). 由于\(S\)为实反对称矩阵, 所以\(P^TSP\)也是实反对称矩阵, 因而存在正交矩阵\(Q\) 使得

\[Q^T(P^TSP)Q=\left(\begin{array}{cccccccc} 0&b_1&&&&&&\\ -b_1&0&&&&&&\\ &&\ddots&&&&&\\ &&&0&b_r&&&\\ &&&-b_r&0&&&\\ &&&&&0&&\\ &&&&&&\ddots&\\ &&&&&&&0 \end{array}\right). \]

其中, \(b_1,b_2,\cdots,b_r\in \mathbb{R}\). 因此,

\[\begin{array}{rl} &(PQ)^T(A+S)(PQ)=E_n+Q^T(P^TSP)Q\\ =&\left(\begin{array}{cccccccc} 1&b_1&&&&&&\\ -b_1&1&&&&&&\\ &&\cdots&&&&&\\ &&&1&b_r&&&\\ &&&-b_r&1&&&\\ &&&&&1&&\\ &&&&&&\cdots&\\ &&&&&&&1 \end{array}\right). \end{array} \]

由于\(Q\)是正交矩阵, 所以\(Q^TQ=E_n\), 从而

\[\begin{array}{rl} &|P|^2\cdot |A+S|=|(PQ)^T(A+S)(PQ)|\\ =&(1+b_1^2)(1+b_2^2)\cdots(1+b_r^2)\\ \geqslant & 1=|E_n|=|P^TAP|=|P|^2\cdot |A|. \end{array} \]

消去\(|P|^2\), 得

\[|A+S|\geqslant |A|. \]

等号成立当且仅当\(b_1=b_2=\cdots=b_r=0\), 当且仅当\(S=O\).