相似无疑是方阵间最重要的一种等价关系. 对于可对角化的矩阵,我们自然可以取相似类中的对角矩阵作为代表元或将矩阵\(A\)分解为\(A=P\Lambda P^{-1}\)(其中\(\Lambda\)为对角矩阵)来解决问题. 对于一般的矩阵,可以考虑Frobenius标准形或Joran标准形矩阵,使相关问题得以简化.
\(\S1\) Schur标准形
任一复方阵都相似于上三角矩阵,史称Schur引理或Jacobi定理,可以看作相似的某种粗略的标准形. 由于上三角矩阵的对角元素就是该矩阵的特征值,所以某些涉及矩阵特征值的相关问题可以通过Schur标准形来解决.
例1.1 设\(A\)为可逆实对称矩阵,\(B\)为实反对称矩阵且\(AB=BA\). 求证:\(A+B\)可逆.
证明 由\(A\)可逆且\(AB=BA\), 则\(A^{-1}B=BA^{-1}\). 于是
由于反对称实矩阵的特征值为零或纯虚数,所以存在可逆矩阵\(P\)使得
所以
因为\(1+\lambda_i\ne 0\), \(i=1,2,\cdots,n\), 所以\(|A+B|\ne 0\), 从而可逆.
例1.2 设\(n\)阶复方阵\(A\)的特征值为\(\lambda_1, \lambda_2,\cdots, \lambda_n\), 则\(A\)的伴随矩阵\(A^*\)的特征值为\(\mu_i=\prod_{j\ne i} \lambda_j,\; i=1,2,\cdots,n\).
证明 由Schur引理知存在可逆矩阵\(P\), 使得
从而
故\(A^*\)的特征值为\(\mu_i=\prod_{j\ne i} \lambda_j,\; i=1,2,\cdots,n\).
例1.3[厦门大学,2008]设\(V\)是复数域\(\mathbb{C}\)上的线性空间,\(\sigma\)是\(V\)的线性变换,求证:存在\(\sigma\)-不变子空间\(V_0,V_1,\cdots,V_n\)使得\(V_0\subseteq V_1\subseteq \cdots\subseteq V_n\), 且\(\dim V_i=i (1\leqslant i\leqslant n)\).
证明 由Schur引理,存在\(V\)的一组基\(\xi_1,\xi_2,\cdots,\xi_n\)使得
令\(V_0=\{0\}, V_i=\mbox{span}(\xi_1,\xi_2,\cdots,\xi_i), i=1,2,\cdots,n\), 则\(V_i\)是\(\sigma\)-不变子空间,\(\dim V_i=i\), 且\(V_0\subseteq V_1\subseteq \cdots\subseteq V_n\).
\(\S2\) Jordan标准形
Jordan标准形定理与Frobenius标准形定理无疑是高等代数中最重要的定理,一个命题若对矩阵\(A\)的相似类正确,则可以取\(A\)的Jordan标准形与Frobenius标准形来解决问题. 大家应该养成使用Jordan标准形或Frobenius标准形考虑相关问题的习惯.
如果\(A\)的极小多项式
则\(r_i=A\)的Jordan标准形中对应于特征值\(\lambda_i\)的最大Jordan块的阶数. 则有如下例题:
例2.1[华东师范大学2021]
设6阶复矩阵\(A,B\)是幂零矩阵,且有相同的秩和极小多项式,证明:\(A,B\)相似.
证明 设\(A,B\)的Jordan标准形分别为\(J_A,J_B\).
(1) \({\rm r}(J_A)={\rm r}(J_B)=0\), 结论显然成立;
(2) \({\rm r}J_A)={\rm r}(J_B)=1\),
则\(J_A\sim J_2(0)\oplus O_{4\times 4}\sim J_B\).
(3)\({\rm r}(J_A)={\rm r}(J_B)=2\),
则\(J_A,J_B\)的可能情形为
如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).
(4)\({\rm r}(J_A)={\rm r}(J_B)=3\),
则\(J_A,J_B\)的可能情形为
如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).
(5)\({\rm r}(J_A)={\rm r}(J_B)=4\),
则\(J_A,J_B\)的可能情形为
如果\(J_A\ne J_B\), 则\(A,B\)的极小多项式也不同,所以\(A\sim B\).
(6)\({\rm r}(J_A)={\rm r}r(J_B)=5\),
则\(J_A=J_B=J_6(0)\), 所以\(A\sim B\).
练习[苏州大学2023]
设\(n\)阶复方阵\(A\)是幂零矩阵(即存在正整数\(m\), 使得\(A^m=O\)), 证明:互不相似的5阶幂零阵最多有7个.
\end{exercise}
例2.2[浙江大学,2006]设3阶矩阵\(A,B,C,D\in\mathbb{C}^{3\times 3}\)具有相同的特征多项式,证明:其中必有两个矩阵相似.
证明 由题设知\(A,B,C,D\)具有相同的特征值,不妨设为\(\lambda_1,\lambda_2,\lambda_3\), 下面分为三种情况讨论:
(1) \(\lambda_1,\lambda_2,\lambda_3\)互不相等,则\(A,B,C,D\)具有Jordan标准形
所以\(A,B,C,D\)彼此相似;
(2) \(\lambda_1,\lambda_2,\lambda_3\)中仅有两个相等,不妨设\(\lambda_1=\lambda_2\), 则\(A,B,C,D\)可能的Jordan标准形为
故\(A,B,C,D\)中至少有两个矩阵或者相似于\(J_1\), 或者相似于\(J_2\), 因而这两个矩阵也相似;
(3) \(\lambda_1=\lambda_2=\lambda_3\), 则\(A,B,C,D\)可能的Jordan标准形为
故\(A,B,C,D\)中至少有两个矩阵相似于\(J_1, J_2,J_3\)中的一个, 因而这两个矩阵也相似.
例2.3 若\(n\)阶矩阵\(A\)的特征值全为零,求证\(A\)必为幂零矩阵.
证明 设\(A\)的Jordan标准形为\(J\), 即存在可逆矩阵\(P\)使得\(P^{-1}AP=J\). 则\(J\)的主对角元为\(0\). 记\(m\)为\(J\)中最大Jordan块的阶数,则\(J^m=O\),从而\(A^m=PJ^mP^{-1}=O\).
例2.4[Voss分解定理] 任一复方阵 都可分解为两个对称矩阵的乘积, 其中一个是可逆矩阵.
证明存在可逆矩阵\(P\)使得\(P^{-1}AP=J=\mbox{diag}(J_1,J_2,\cdots,J_s)\), 其中\(J_i=J_{n_i}(\lambda_i)\), \(i=1,2,\cdots,s\). 令
则\(N_i^{-1}=N_i^T=N_i\), 且\(N_iJ_{n_i}^T(\lambda_i)N_i=J_{n_i}(\lambda_i)\). 令
\(N=\mbox{diag}(N_1,N_2,\cdots,N_s)\), 则\(N^{-1}=N^T=N\), 且\(J=NJ^TN\).
故
令\(B=PNP^T\), \(C=A^T(P^{-1})^TNP^{-1}=A^TB^{-1}\), 则\(A=BC\). 由于
所以\(B,C\)都是对称矩阵, 且\(B\)可逆.
例2.5[华中师范大学1993] 设\(\mathscr{A}\)是数域\(\mbox{F}\)上\(n\)维线性空间\(V\)上的线性变换. 证明\(V= \mbox{Im} (\mathscr{A})\oplus \mbox{Ker}(\mathscr{A})\)的充要条件是\(0\)是\(\mathscr{A}\)的极小多项式的单根.
证明 先证\(V= \mbox{Im} (\mathscr{A})\oplus \mbox{Ker}(\mathscr{A})\Longleftrightarrow\) \({\rm r}(\A^2)={\rm r}(\mathscr{A})\).
充分性:由维数公式
而\(\dim\mbox{Im}\mathscr{A}={\rm r}(\mathscr{A})\), 故\(\dim\mbox{Im}\mathscr{A}=\dim\mbox{Im}\mathscr{A}^2\), 从而
\(\dim\mbox{Ker}\mathscr{A}=\dim\mbox{Ker}\mathscr{A}^2\). 由于\(\mbox{Ker}\mathscr{A}\subseteq \mbox{Ker}\mathscr{A}^2\), 所以\(\mbox{Ker}\mathscr{A}=\mbox{Ker}r\mathscr{A}^2\).
\(\forall \alpha\in\mbox{Im}\mathscr{A}\cap\mbox{Ker}\mathscr{A}\), 则\(\alpha=\mathscr{A}\xi\), \(\xi\in V\); 而且\(\mathscr{A}\alpha=0\). 所以\(\mathscr{A}^2\xi=\mathscr{A}\alpha=0\), 即\(\xi\in\mbox{Ker}\mathscr{A}^2=\mbox{Ker}\mathscr{A}\). 从而\(\alpha=\mathscr{A}\xi=0\). 即\(\mbox{Im}\mathscr{A}\cap\mbox{Ker}\mathscr{A}=0\). 又\(\dim\mbox{Im}\mathscr{A}+\dim\mbox{Ker}\mathscr{A}=n\), 所以\(V=\mbox{Im}\mathscr{A}\oplus\mbox{Ker}\mathscr{A}\).
必要性:\(\forall \alpha\in\mbox{Im}\mathscr{A}\), \(\exists \beta\in V\), s.t. \(\mathscr{A}\beta=\alpha\). 又因为\(V=\mbox{Im}\mathscr{A}\oplus\mbox{Ker}\mathscr{A}\), 所以可设
\(\beta=\mathscr{A}\beta_1+\beta_2\), \(\beta_1\in V,\beta_2\in \mbox{Ker}\mathscr{A}\). 故
即\(\mbox{Im}\mathscr{A}\subseteq \mbox{Im}\mathscr{A}^2\);又\(\mbox{Im}\mathscr{A}^2\subseteq \mbox{Im}\mathscr{A}\), 所以\(\mbox{Im}\mathscr{A}=\mbox{Im}\mathscr{A}^2\), 从而\({\rm r}(\mathscr{A})={\rm r}(\mathscr{A}^2)\).
而\({\rm r}(\mathscr{A})={\rm r}(\mathscr{A}^2)\). \(\Longleftrightarrow\) \(\mathscr{A}\)的Jordan 标准形中特征值为\(0\)的Jordan块是\(1\)阶的\(\Longleftrightarrow\) \(0\)是\(\mathscr{A}\)的极小多项式的单根.
例2.6 设\(\lambda_0\)是\(n\)阶复矩阵\(A\)的\(k\)重特征值,则\(\r(\lambda_0E-A)^k=n-k\).
证明 设存在可逆矩阵\(P\)使得\(P^{-1}AP=J\)为\(A\)的Jordan标准形,则
因此只需证明\(\r(\lambda_0E-J)^k=n-k.\)
设\(J_1=J_s(\lambda_0)\)是对应于特征值\(\lambda_0\)的Jordan块,则\(s\leqslant k\), 从而\((\lambda_0E-J_1)^k=O\). 由此知\(J\)中对应于特征值\(\lambda_0\)的任意Jordan块的\(J_i\), \((\lambda_0E-J_i)^k=O\). 而对其它的Jordan块\(J_t\), \((\lambda_0E-J_t)^k\)可逆,所以\(\r(\lambda_0E-J)^k=n-k\).
例2.7[东南大学2004] 设\(A\)是\(n\)阶方阵,求证:存在正整数\(k\)使得\(\r(A^k)=\r(A^{k+1})\), 并证存在\(n\)阶方阵\(B\)使得\(A^k=A^{k+1}B\).
证明 (1) 若\(0\)不是\(A\)的特征值,则\(A\)可逆,结论显然成立.
(2) 设\(0\)是\(A\)的特征值,存在可逆矩阵\(P\)使得\(P^{-1}AP=J=\mbox{diag}(J_0,J_1)\), 其中\(J_0,J_1\)分别是由零特征值与非零特征值对应的Jordan块构成的子块. 设\(J_0\)中最大Jordan快的阶数是\(k\), 则\(J_0^k=O\), 从而
\(P^{_1}A^kP=J^k=\mbox{diag}(O,J_i^k)\). 故
进一步地,取\(B=P\begin{pmatrix} O&\\ &J_1^{-1} \end{pmatrix}\)即满足要求.
回顾一下,设\(\lambda\)是\(n\)阶矩阵\(A\)的任一特征值,
是对应于特征值\(\lambda\)的广义特征子空间.
例2.8 对于特征值\(\lambda_i\), \(i=1,2,\cdots,s\),
(1) \(\dim V^{\lambda_i}=\lambda_i\)的代数重数=对应于特征值\(\lambda_i\)的Jordan块阶数之和;
(2) (中国科学院2011) \(\dim V_{\lambda_i}=\lambda_i\)的几何重数=对应于特征值\(\lambda_i\)的Jordan块的数目.
证明 设矩阵\(A\)相似于Jordan形矩阵\(J=\mbox{diag}(J(\lambda_1),J(\lambda_2),\cdots, J(\lambda_s))\), 其中
(1) 由于$$(J-\lambda_i E){n_i}=\left(\begin{smallmatrix}J(\lambda_1-\lambda_i)&&&&&&\
&\ddots&&&&&\ &&J(\lambda_{i-1}-\lambda_i)^{n_i}&&&&\ &&&O&&&\
&&&&J(\lambda_{i+1}-\lambda_i)^{n_i}&&\ &&&&&\ddots&\
&&&&&&J(\lambda_s-\lambda_i)^{n_i}\end{smallmatrix}\right),$$ 由于当\(j\ne i\)时, \(\lambda_j-\lambda_i\ne 0\), 故下三角矩阵的方幂
\(J(\lambda_j-\lambda_i)^{n_i}\)满秩. 所以
\(\dim V^{\lambda_i}=n-\r\big({J-\lambda_iE}\big)^{n_i}=n_i.\)
(2) 注意到\(\r(J-\lambda_i E)=n-\)对应于特征值\(\lambda_i\)的Jordan块的数目, 所以
\(\dim V_{\lambda_i}=n-\r(A-\lambda_i E) =\)对应于特征值\(\lambda_i\) 的Jordan块的数目.
练习[中国科学院2006,\(n=2006\)] 设\(A\in\mathbb{R}^{n\times n}\)是给定的幂零矩阵,试分析
线性方程组\(Ax=0\)非零独立解个数的最大值与最小值.
例2.9 设\(A\)是复数域上的\(n\)阶方阵, 则\(A\)可对角化当且仅当\(\forall \lambda\in\mathbb{C}\), \(\r(\lambda E-A)=\r(\lambda E-A)^2\).
证明 必要性显然, 下证充分性.
由Jordan标准形定理知\(A\)相似于Jordan形矩阵\(J\). 若存在Jordan块\(J_k(\lambda)\) 使得\(k>1\), 则\(\r(\lambda E_k-J)>\r(\lambda E_k-J)^2\), 从而\(\r(\lambda E-A)>\r(\lambda E-A)^2\), 矛盾. 故\(J\)中的Jordan块都是一阶的, 即\(J\)为对角矩阵.
利用Jordan标准形可得到矩阵的两种分解,一是将矩阵分解为对角部分(可对角化部分)与幂零部分之和,即Chevalley分解;另一是分解成特征值为0的Jordan块与特征值非零的Jordan块的直和.
例2.10[2011第三届大数竞赛预赛] 设\(A\)是数域\(\mF\)上的\(n\)阶不可逆方阵, 而且\(A\)不是幂零矩阵,证明:\(A\sim \left(\begin{array}{cc} B&O\\ O&C \end{array}\right)\), 其中\(B\)是幂零矩阵, \(C\)是可逆矩阵.
证明 设\(A\)的Jordan标准形为
因为\(A\)不可逆,所以存在零特征值. 又因为\(A\)不是幂零矩阵,所以也存在非零特征值.
不妨设\(\lambda_i=0(i=1,2,\cdots,s), \lambda_J\ne 0(j=s+1,s+2,\cdots,k)\). 令
为幂零矩阵,
为可逆矩阵,且\(J=\begin{pmatrix}B&O\\ O&C\end{pmatrix}\).
例2.11 设\(n\)阶复矩阵\(A,B\)满足\(AB=BA=O, {\rm r}(A)={\rm r}(A^2)\), 则\({\rm r}(A+B)={\rm r}(A)+{\rm r}(B)\).
证明 因为\({\rm r}(A)={\rm r}(A^2)\), 所以, 类似于上题的分析, 特征值为\(0\)的Jordan块都是一阶的, 于是由Jordan标准形, 存在可逆矩阵\(P\), 使得
由于\(AB=BA=O\), 设\(P^{-1}BP=B_1\), 则\(A_1B_1=B_1A_1=O\), 于是
\(B_1\)形如
且\({\rm r}(B)={\rm r}(B_1)={\rm r}(D)\), 故
例2.12 设\(A\)是复数域上的\(n\)阶方阵, 则\(A\)与\(A^T\)相似.
证明 证法一:由Jordan标准形定理, 设\(A\sim \oplus_{i=1}^kJ_{n_i}(\lambda_i)\). 令
则\(N_i^{-1}J_{n_i}(\lambda_i)N_i=J_{n_i}(\lambda_i)^T\), 所以令\(N=\oplus_{i=1}^kN_i\), 则\(N^{-1}AN=A^T\).
证法二:显然\(A\)与\(A^T\)有相同的行列式因子, 因而它们相似.
例2.13 设\(A\)是\(n\)阶复方阵,设\(\lambda_i\)是\(A\)的任一特征值, \(A\)的Jordan标准形中仅有一个对应的Jordan 块,当且仅当\(\lambda_i\)的几何重数\(\dim V_{\lambda_i}=1\).
证明 必要性:由于\(A\sim J\), 它们有相同的特征值, 且每个特征值的几何重数(即对应特征子空间的维数)相同. 所以我们只需考虑\(A\)的Jordan标准形\(J\). 为方便, 我们不妨考虑特征值\(\lambda_1\). 很清楚, \(J\varepsilon_{n_1}=\lambda_1\varepsilon_{n_1}\), 所以\(\varepsilon_{n_1}\)是\(J\)的一个属于\(\lambda_1\) 的非零特征向量. 又因为
所以\(\r(\lambda_1 E-J)=n-1\). 故\(\dim V_{\lambda_1}=1\).
类似地, \(\dim V_{\lambda_i}=1\), \(i=1,2,\cdots,s\).
充分性: 由于特征值\(\lambda_i\)的几何重数等于\(J\)中
属于\(\lambda_i\)的Jordan块的个数, 所以\(\dim V_{\lambda_i}=1\) 暗示着Jordan标准形\(J\)中仅有一个对应于\(\lambda_i\)的Jordan 块.
利用Jordan标准形解决相关问题,其一般转化路线为:
一般\(n\)阶矩阵\(\rightarrow\)Jordan形矩阵\(\rightarrow J_n(\lambda)\rightarrow J_n(0)\).
设\(A\)是数域\(F\)上的\(n\)阶方阵,
称为\(A\)的中心化子.
例2.14
对任意的\(n\)阶复方阵,\(\dim \mathcal{C}(A)\geqslant n\).
证明
取可逆矩阵\(P\)使得\(P^{-1}AP=J\)为Jordan标准形,定义线性同构
则容易验证\(\mathcal{C}(J)=\sigma_P(\mathcal{C}(A)\), 因而\(\dim\mathcal{C}(A)=\dim\mathcal{C}(J)\). 所以不妨设\(A\)本身是Jordan标准形矩阵
其中
\(J_i=J(\lambda_i)\)是对应于特征值\(\lambda_i\)的Jordan形矩阵,且\(\lambda_i\)互异, \(1\leqslant i\leqslant s.\)
所以
令\(J_i=\lambda_iE_{n_i}+J(i,0), \; J(i,0)=\oplus_k J_{n_{i_k}}(0)\), 则
因为\(\dim\mathcal{C}(J(i,0))=\dim\mathcal{C}(\oplus_k J_{n_{i_k}}(0))\geqslant \sum_k\dim\mathcal{C}(J_{n_{i_k}}(0)))=n_i\), 所以
例2,15 设\(\sigma\)是复数域上\(n\)维线性空间\(V\)上的线性变换,则\(\sigma\)可对角化当且仅当对于\(\sigma\)的任意特征值\(\lambda\), 都有\(\mbox{Im}(\sigma-\lambda \mbox{id}_V)\cap\mbox{Ker}(\sigma-\lambda \mbox{id}_V)=0\).
证明 充分性:(反证法)假设\(\sigma\)不可对角化,则存在\(V\)的一组基使得\(\sigma\)在该基下的Jordan形矩阵\(J\)有一个大于\(1\)阶的Jordan块,不妨设为
\(J_s(\lambda_1), s>1\). 由于
所以
矛盾!故\(\sigma\)可对角化.
必要性:若\(\sigma\)可对角化,设存在\(V\)的一组基使得\(\sigma\)在该基下的矩阵为
其中\(\lambda_1,\lambda_2,\cdots,\lambda_s\)两两不同. 则对任意的特征值\(\lambda_i\),
所以
\(\mbox{Im}(\sigma-\lambda_i \mbox{id}_V)\cap\mbox{Ker}(\sigma-\lambda_i \mbox{id}_V)=0\).
例2.16 设\(A,B\in\mathbb{C}^{n\times n}\), \(C=AB-BA\)且\(AC=CA\), 则\(C\)是幂零矩阵.
证明 设存在可逆矩阵\(P\)使得
其中\(C_i=J_{n_i}(\lambda_i)\)是由对应于特征值\(\lambda_i\)的Jordan块组成的分块对角矩阵(\(i=1,2,\cdots,s\)). 记\(\bar{A}=P^{-1}AP\). 由于\(AC=CA\), 则\(\bar{A}\bar{C}=\bar{C}\bar{A}\). 由于\(C_i\)具有不同的特征值,所以
按照\(\bar{A}\)的分块方法,将\(\bar{B}=P^{-1}BP\)进行分块
则由\(C=AB-BA\)可得
故\(Tr(C_i)=0\), \(i=1,2,\cdots,s.\) 由于\(C_i\)是上三角矩阵,对角元是特征值\(\lambda_i\), 所以\(\lambda_i=0\),\(i=1,2,\cdots,s.\) 故\(\bar{C}\)是幂零矩阵,从而\(C\)是幂零矩阵.
例2.17[上海交通大学2018,华东师范大学2002] 设\(A,B\)是\(n\)阶方阵,\(\r(A)=n-1\), \(B\ne O\)满足\(AB=BA=O\). 求证:存在多项式\(g(x)\)使得\(B=g(A)\).
证明
设存在可逆矩阵\(P\)使得\(P^{-1}AP=J\)为Jordan标准形,由于\(AB=BA=O\)得
由于\(\r(J)=\r(A)=n-1\), 所以\(J\)可能为以下三种情形:
(1) \(J=\begin{pmatrix} 0&\\ &J_1\end{pmatrix}\), 其中\(J_1\)是非零特征值对应的\(n-1\)阶Jordan形矩阵. 对\(P^{-1}BP\)进行相应的分块代入上面的式子可得
\(P^{-1}BP=\begin{pmatrix} b&\\ &O\end{pmatrix}, b\ne 0\). 由于
\(B=g(A)\)当且仅当
这等价于\(g(0)=b\)且\(g(J_1)=O\), 即\(g(x)\)是\(J_1\)的常数项等于\(b\)的零化多项式. 由于\(J_1\)可逆,所以\(J_1\)的极小多项式的常数项\(a_0\ne 0\). 令\(g(x)=\frac{b}{a_0}m_A(x)\), 则有\(B=g(A)\).
(2) \(J=J_n(0)\). 则由\ref{Con-4.5.30}知存在常数\(b\ne 0\)使得
因此\(P^{-1}BP=bJ^{n-1}=b(P^{_1}AP)^{n-1}=P^{_1}(bA^{n-1})P\). 令\(g(x_=bx^{-1}\), 则\(B=g(A)\).
(3) \(J=\begin{pmatrix} J_0&\\ &J_1\end{pmatrix}\), 其中, \(J_0=J_r(0)\), \(J_1\)是非零特征值对应的\(n-r\)阶Jordan形矩阵.
对\(P^{-1}BP\)进行相应的分块代入\ref{Con-4.5.30}可得
\(P^{-1}BP=\begin{pmatrix} B_0&\\ &O\end{pmatrix}\), 其中
显然\(B_0=bJ_0^{r-1}\). 由于
\(B=g(A)\)当且仅当
这等价于\(g(J_0)=B_0\)且\(g(J_1)=O\). 即\(g(x)\)是\(J_1\)的零化多项式且\(g(J_))=bJ_0^{r-1}\).
由于当\(k\geqslant r\)时,\(J_0^k=O\). 令\(g(x)=\frac{b}{a_0}x^{r-1}m_{J_1}(x)\), 其中\(m_{J_1}(x)\)是\(J_1\)的极小多项式,其常数项为\(a_0\). 则\(g(J_0)=B_0\), 从而\(B=g(A)\).
\(\S3\) Frobenius标准形
定理3.1[Frobenius定理] 设\(A\)是数域\(\mbox{F}\)上的\(n\)阶方阵,\(f_A(\lambda), m_A(\lambda)\)分别是\(A\)的特征多项式与极小多项式,则
(1) \(m_A(\lambda)=d_n(\lambda)\left(=\frac{f_A(\lambda)}{D_{n-1}(\lambda)}\right)\), 即\(A\)的极小多项式是\(A\)的最后一个不变因子;
(2) \(f_A(\lambda)\)在数域\(\mbox{F}\)上的不可约因式都是\(m_A(\lambda)\)的因式.
证明 (1) 设
由于相似矩阵具有相同的极小多项式,所以
其中\(m_i(\lambda)\)是\(C_i\)的极小多项式,\(i=1,2,\cdots,s\).
由\ref{MinPoly-FroBlock}知\(m_i(\lambda)=d_i(\lambda)\), 且\(d_i(\lambda)\mid d_{i+1}(\lambda)\), 所以\(m_A(\lambda)=d_n(\lambda)\).
(2) 设\(f_A(\lambda)\)在\(\mbox{F}\)上的典型分解式为
由于\(f_A(\lambda)=d_1(\lambda)d_2(\lambda)\cdots d_s(\lambda)\), 所以
由于\(p_1(\lambda)\)不可约,所以存在\(i\), 使得\(p_1(\lambda)\mid d_i(\lambda)\). 由于
所以\(p_1(\lambda)\mid d_n(\lambda)=m_A(\lambda)\). 类似地,\(p_i(\lambda)\mid m_A(\lambda)\), \(i=2,3,\cdots,s\).
例3.1[首都师范大学,2012]设\(V\)为有理数域上的线性空间,\(\varphi\)为\(V\)上的非零线性变换,且\(\varphi^4=4\varphi^2-2\varphi\). 证明: \(V=\mbox{Im}(\varphi)\oplus \mbox{Ker}(\varphi)\), 且\(\varphi\)有一个3维\(\varphi\)-不变子空间.
证明 任取\(\alpha\in \mbox{Im}(\varphi)\cap \mbox{Ker}(\varphi)\), 则\(\varphi(\alpha)=0\), 且存在\(\beta\in V\)使得\(\varphi(\beta)=\alpha\), 从而
故\(\alpha=0\), 即\(\mbox{Im}(\varphi)\cap \mbox{Ker}(\varphi)=0\). 由秩-零度定理得
故\(V=\mbox{Im}(\varphi)\oplus \mbox{Ker}(\varphi)\).
由于\(f(\lambda)=\lambda(\lambda^3-4\lambda+2)\)是\(\varphi\)的一个零化多项式,所以\(\varphi\)的极小多项式\(m(\lambda)\mid f(\lambda)\). 由\(\lambda^3-4\lambda+2\)在有理数域上不可约,故\(m(\lambda)=\lambda^3-4\lambda+2\)或\(\lambda(\lambda^3-4\lambda+2)\).
若\(m(\lambda)= \lambda^3 -4\lambda+2\),对应的Frobenius块为\(C=\begin{pmatrix} 0&0&-2\\ 1&0&4\\ 0&1&0\end{pmatrix}\). 则存在\(V\)的线性无关的向量\(\alpha_1,\alpha_2,\alpha_3\), 使得
令\(W=\mbox{span}(\alpha_1,\alpha_2,\alpha_3)\), 则\(W\)是一个3维\(\varphi\)-不变子空间.
若\(m(\lambda)= \lambda(\lambda^3 -4\lambda+2)\),对应的Frobenius块为\(C=\begin{pmatrix} 0&0&0&0\\ 1&0&0&-2\\ 0&1&0&4\\ 0&0&1&0\end{pmatrix}\). 则存在\(V\)的线性无关的向量\(\alpha_1,\alpha_2,\alpha_3,\alpha_4\), 使得
令\(W=\mbox{span}(\alpha_2,\alpha_3,\alpha_4)\), 则\(W\)是一个3维\(\varphi\)-不变子空间.
例3.2 若\(A\)的Frobenius标准形是一个Frobenius块,则\(A\)有一个\(n\)阶循环向量, 即存在\(v\in V\), 使得\(v, Av, \cdots, A^{n-1}v\)线性无关.
证明 设存在可逆矩阵\(P\)使得\(P^{-1}AP=C\). 由Frobenius块的定义得
所以\(e_1,Ce_1,\cdots,C^{n-1}e_1\) 线性无关. 令\(v=Pe_1\), 则\(v, Av, \cdots, A^{n-1}v\) 线性无关.
例3.3 设数域\(\mbox{F}\)上的\(n\)阶矩阵\(A\)的不变因子为
若\(n\)阶矩阵\(B\)满足\(AB=BA\), 则存在\(n-1\)次多项式\(g(x)\in F[x]\)使得\(B=g(A)\).
证明 由题设知存在可逆阵\(P\)使得\(P^{-1}AP=C\)为Frobenius块. 记\(P^{-1}BP=B_1\), 则由\(AB=BA\)知\(CB_1=B_1C\). 由于\(C^{i-1}e_1=e_i\), \(i=2,3,\cdots,n\), 所以
设\(B_1e_1=(b_1,b_2,\cdots,b_n)^T\), 则\(B_1e_1=\sum_{i=1}^nb_ie_i\). 于是上式变为
其中, \(g(x)=\sum_{i=1}^nb_ix^{i-1}\). 所以
练习(清华大学,2000) 试证明:若方阵\(A\)相似于某个多项式的友阵,则与\(A\)可交换的矩阵只能是\(A\)的多项式.
例3.4 矩阵\(C\)是换位子的充要条件是\(Tr(C)=0\).
证明 必要性:如果矩阵\(C\)是换位子, 即存在矩阵\(A,B\), 使得\(C=AB-BA\), 则\(Tr(C)=Tr(AB-BA)=Tr(AB)-Tr(BA)=0\).
充分性:我们首先证明, 如果\(Tr(C)=0\), 则\(C\)必相似于对角线全为零的矩阵.
对\(C\)的阶数\(n\)用数学归纳法, \(n=1\)时显然成立. 假设该结论对小于\(n\)的矩阵成立. 考虑\(n\)阶矩阵\(C\), 设\(\Gamma\)为Frobenius 标准形. 如果\(\Gamma\)中的Frobenius 块都是一阶的, 则\(C\)的不变因子必为
即\(\Gamma=c E_n\). 由\(Tr(C)=0\)知\(c=0\), 所以\(C=O\). 故若\(C\ne 0\), 则\(\Gamma\)中必有一个阶大于1的Frobenius 块. 因此存在可逆矩阵\(P\)使得
由\(Tr(C)=0\)知\(Tr(C_1)=0\). 故由归纳假设知存在\(n-1\)阶可逆矩阵\(Q\)使得
\(Q^{-1}C_1Q\)的对角线全为零. 令
\(R=P\left(\begin{array}{cc}
1&\\ &Q
\end{array}\right)\), 则\(R^{-1}CR\)的主对角元全为零.
不失一般性, 我们可以假设\(C=(c_{ij})\)的主对角元全为零. 设
则由\(AB-BA=C\)可得
即
所以满足\(C=AB-BA\)的矩阵\(A,B\)存在, 即\(C\)是矩阵换位子.
\(\S4\) 实(反)对称矩阵的相似对角化
例4.1 [2 16第七届大数竞赛] 设\(A,B\)为\(n\)阶实对称矩阵, 则\(Tr((AB)^2)\leqslant Tr(A^2B^2)\).
证明 因为\(A\)是实对称矩阵, 所以存在正交矩阵\(P\)使得
则\(\bar{B}=P^{-1}BP=(b_{ij})\)仍为实对称矩阵, 且
所以
所以
即\(Tr((AB)^2)\leqslant Tr(A^2B^2)\).
例4.2 设\(\lambda_1\)是实对称矩阵\(A\)的\(r\)重特征值,其余特征值为\(\lambda_{r+1},\lambda_{r+2},\) \(\cdots,\lambda_n\). 令\(C=\prod_{j=r+1}^n(\lambda_jE-A)\), 则对应于\(\lambda_1\)的特征子空间\(V_{\lambda_1}\)等于\(C\)的列空间\(\mbox{col}(C)\).
证明 因为\(A\)是实对称矩阵,所以存在可逆矩阵\(P\)使得\( A=P\Lambda P^{-1}\), 其中
所以\(C=\prod_{j=r+1}^n(\lambda_j-\lambda_1) P\begin{pmatrix} E_r&O\\ O&O \end{pmatrix}P^{-1}\), 且\(\r(C)=r\). 令\(a=\prod_{j=r+1}^n(\lambda_j-\lambda_1)\), 则
所以\(C\)的列向量都是属于特征值\(\lambda_1\)的特征向量,而\(\r(C)=r\), 从而\(C\)有\(r\)个线性无关的列向量,故\(V_{\lambda_1}=\mbox{col}(C)\).
例4.3 设\(A\)为\(n\)阶实正定对称矩阵, \(S\)为实反对称矩阵. 证明
且等号成立当且仅当\(S=O\).
证明因为\(A\)是正定矩阵, 所以存在可逆矩阵\(P\), 使得\(P^TAP=E_n\). 由于\(S\)为实反对称矩阵, 所以\(P^TSP\)也是实反对称矩阵, 因而存在正交矩阵\(Q\) 使得
其中, \(b_1,b_2,\cdots,b_r\in \mathbb{R}\). 因此,
由于\(Q\)是正交矩阵, 所以\(Q^TQ=E_n\), 从而
消去\(|P|^2\), 得
等号成立当且仅当\(b_1=b_2=\cdots=b_r=0\), 当且仅当\(S=O\).