分块矩阵法是高等代数中处理矩阵相关问题的最重要的方法之一, 其重要性可以说怎么强调都不过分. 分块矩阵法的核心思想是根据具体问题构造适当的分块矩阵, 然后运用广义初等变换, 将某些子块消为零块, 得到特殊的分块矩阵从而解决问题. 该方法几乎贯穿了线性代数的始终, 在矩阵求逆、矩阵秩不等式、行列式、线性方程组、线性变换、二次型等方面有着广泛的应用.

例如, 证明行列式的乘法公式\(|AB|=|A|\cdot |B|\)时, 我们就构造了分块矩阵

\[\left(\begin{array}{cc} A&O \\ -E& B \end{array}\right). \]

作广义初等变换

\[\left(\begin{array}{cc} A&O \\ -E& B \end{array}\right) \stackrel{c_1\cdot B+c_2}{\longrightarrow} \left(\begin{array}{cc} A&AB \\ -E& O \end{array}\right) \stackrel{r_1\leftrightarrow r_2}{\longrightarrow} \left(\begin{array}{cc} -E& O\\ A&AB \end{array}\right). \]

取行列式, 得

\[|A|\cdot |B|=\left|\begin{array}{cc} A&O \\ -E& B \end{array}\right|=(-1)^n \left|\begin{array}{cc} -E& O\\ A&AB \end{array}\right|=(-1)^n|-E_n|\cdot |AB|, \]

\(|AB|=|A|\cdot |B|\).

再例如, 若子矩阵块\(A\)可逆,利用初等变换将分块矩阵\(\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)\)
的子块\(C\)消成\(O\), 即

\[\left(\begin{array}{cc} A&B\\ C& D \end{array}\right) \stackrel{r_1\cdot -CA^{-1}+r_2}{\longrightarrow} \left(\begin{array}{cc} A&B \\ O& D-CA^{-1}B \end{array}\right). \]

得到行列式

\[\left|\begin{array}{cc} A&B\\ C& D \end{array}\right| =\left|\begin{array}{cc} A&B \\ O& D-CA^{-1}B \end{array}\right|=|A|\cdot|D-CA^{-1}B|. \]

该式有时也称为行列式的降阶公式.

\(\S1\) 由于广义初等变换不改变矩阵的秩,所以 关于矩阵秩的等式或不等式的证明, 分块矩阵法可以大显神通. 使用该方法的主要思路是根据等式或不等式的一边,利用下面例2中的等式或不等式,构造合适的分块矩阵,对其实施分块矩阵的初等变换,得到等式或不等式的另一边的秩关系.

例1\(A_{m\times n}\,,\,B_{n\times l}\), 则\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).

证明 由于

\[(A,\; AB)\left(\begin{array}{cc} E&-B\\ O&E \end{array}\right)= (A,\; O),\quad \left(\begin{array}{cc} E&O\\ -A&E \end{array}\right) \left(\begin{array}{c} B\\ AB \end{array}\right) =\left(\begin{array}{c} B\\ O \end{array}\right), \]

所以

\[\begin{array}{c} {\rm r}(AB)\leqslant {\rm r}(A,\; AB)={\rm r}(A,\; O)={\rm r}(A),\;\\ {\rm r}(AB)\leqslant {\rm r}\left(\begin{array}{c} B\\ AB \end{array}\right)={\rm r}\left(\begin{array}{c} B\\ O \end{array}\right)={\rm r}(B), \end{array} \]

\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).

例2 \({\rm r}(A)+{\rm r}(B)={\rm r}\begin{pmatrix}A&O\\O&B \end{pmatrix}\leqslant {\rm r}\begin{pmatrix}A&O\\C&B\end{pmatrix}\,\).

证明\({\rm r}(A)=r_1\), \({\rm r}(B)=r_2\), 则存在可逆矩阵\(P_1,Q_1\)\(P_2, Q_2\) 使得

\[P_1AQ_1=\begin{pmatrix}E_{r_1}&\\ &O\end{pmatrix}, \qquad P_2BQ_2=\begin{pmatrix}E_{r_2}&\\ &O\end{pmatrix}. \]

从而

\[\begin{pmatrix}P_1&\\ &P_2\end{pmatrix} \begin{pmatrix}A&\\ &B\end{pmatrix} \begin{pmatrix}Q_1&\\ &Q_2\end{pmatrix} =\left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline &&E_{r_2}&\\ &&&O\end{array}\right). \]

所以由(1)得

\[{\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}=r_1+r_2={\rm r}(A)+{\rm r}(B). \]

另一方面, 由于通过初等变换,

\[\begin{array}{rl} &\begin{pmatrix}A&O\\ C&B\end{pmatrix}\rightarrow \left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline D_{11}&D_{12}&E_{r_2}&\\ D_{21}&D_{22}&&O\end{array}\right)\\ \rightarrow & \left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline O&O&E_{r_2}&\\ O&D&&O\end{array}\right)\rightarrow \left(\begin{array}{cccc}E_{r_1}&&&\\ &E_{r_2}&&\\ &&D&\\&&&O\end{array}\right), \end{array} \]

所以

\[{\rm r}\begin{pmatrix}A&O\\ C&B\end{pmatrix}=r_1+r_2+{\rm r}(D)\geqslant r_1+r_2={\rm r}(A)+{\rm r}(B). \]

例3\(A,B\)是同阶矩阵,则
\(|{\rm r}(A)-{\rm r}(B)|\leqslant {\rm r}(A\pm B)\leqslant {\rm r}(A)+{\rm r}(B)\).

证明 由于

\[\begin{pmatrix}A&\\ &B\end{pmatrix}\rightarrow \begin{pmatrix}A&O\\ A&B\end{pmatrix}\rightarrow \begin{pmatrix}A&A\\ A&A+B\end{pmatrix}, \]

所以

\[{\rm r}(A+B)\leqslant {\rm r}\begin{pmatrix}A&A\\ A&A+B\end{pmatrix} ={\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}={\rm r}(A)+{\rm r}(B). \]

另一方面, 不妨设\({\rm r}(A)\geqslant {\rm r}(B)\), 则由

\[\begin{pmatrix}A+B&\\ &B\end{pmatrix}\rightarrow \begin{pmatrix}A+B&B\\ O&B\end{pmatrix}\rightarrow \begin{pmatrix}A&B\\ -B&B\end{pmatrix}, \]

可得

\[{\rm r}(A)\leqslant {\rm r}\begin{pmatrix}A&B\\ -B&B\end{pmatrix} ={\rm r}\begin{pmatrix}A+B&\\ &B\end{pmatrix} ={\rm r}(A+B)+{\rm r}(B), \]

\[{\rm r}(A)-{\rm r}(B)\leqslant {\rm r}(A+B). \]

而且,

\[{\rm r}(A)={\rm r}(A-B+B)\leqslant{\rm r}(A-B)+{\rm r}(B)\,, \]

所以 \({\rm r}(A)-{\rm r}(B)\leqslant{\rm r}(A-B)\),.
类似地,

\[{\rm r}(B)-{\rm r}(A)\leqslant{\rm r}(B-A)={\rm r}(A-B)\,. \]

所以
\(|{\rm r}(A)-{\rm r}(B)|\leqslant{\rm r}(A-B)\),,

\[|{\rm r}(A)-{\rm r}(B)|\leqslant{\rm r}(A\pm B)\,. \]

例4 [第一降阶定理]
\(A\)是可逆矩阵, \(\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)\)\((r,m-r)\times (r,m-r)\)分块矩阵. 证明\({\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B)\).

证明 因为

\[\left(\begin{array}{cc} E_r&O \\ -CA^{-1}& E_{m-r} \end{array}\right) \left(\begin{array}{cc} A&B \\ C& D \end{array}\right) \left(\begin{array}{cc} E_r&-A^{-1}B \\ O& E_{m-r} \end{array}\right)= \left(\begin{array}{cc} A&O \\ O& D-CA^{-1}B \end{array}\right), \]

\(\left(\begin{array}{cc} E_r&O \\ -CA^{-1}& E_{m-r} \end{array}\right)\)\(\left(\begin{array}{cc} E_r&-A^{-1}B \\ O& E_{m-r} \end{array}\right)\)都是非异矩阵, 所以

\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B). \]

例5 [第二降阶定理]
\(A,D\)分别是\(r,s\)阶非奇异矩阵, \(B\in F^{r\times s}\), \(C\in F^{s\times r}\), 则

\[{\rm r}(D-CA^{-1}B)={\rm r}(D)-{\rm r}(A)+{\rm r}(A-BD^{-1}C). \]

证明 由第一讲解定理得

\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B). \]

另一方面, 由\(D\)非奇异知

\[\left(\begin{array}{cc} E_r&-BD^{-1} \\ O& E_{m-r} \end{array}\right) \left(\begin{array}{cc} A&B \\ C& D \end{array}\right) \left(\begin{array}{cc} E_r&O \\ -D^{-1}C& E_{m-r} \end{array}\right)= \left(\begin{array}{cc} A-BD^{-1}C&O \\ O& D \end{array}\right), \]

所以

\[{\rm r}\left(\begin{array}{cc} A&B \\ C& D \end{array}\right)={\rm r}(D)+{\rm r}(A-BD^{-1}C). \]

\[{\rm r}(D-CA^{-1}B)={\rm r}(D)-{\rm r}(A)+{\rm r}(A-BD^{-1}C). \]

例6\(A\)\(m\times n\)矩阵, 证明

\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n. \]

*证明 由\ref{No.2-RedOrder}知

\[\begin{array}{rl} {\rm r}(E_m-AA^T)={\rm r}(E_m-AE_nA^T)&={\rm r}(E_m)-{\rm r}(E_n)+{\rm r}(E_n-A^TE_mA)\\ &=m-n+{\rm r}(E_n-A^TA). \end{array} \]

\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n. \]

例7 [Sylvester不等式]
\(A,B\)\(n\)阶方阵,则\({\rm r}(A)+{\rm r}(B)\leqslant {\rm r}(AB)+n\).

** 证明** 对分块矩阵作广义初等变换, $$\begin{pmatrix}A&O\E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&O\end{pmatrix}\rightarrow\begin{pmatrix}E&O\O&AB\end{pmatrix},.$$
由(3)得

\[{\rm r}(A)+{\rm r}(B)\leqslant{\rm r}\begin{pmatrix}A&O\\ E&B\end{pmatrix}={\rm r}\begin{pmatrix}E&O\\ O&AB\end{pmatrix}={\rm r}(AB)+n,\]

\[{\rm r}(A)+{\rm r}(B)-n\leqslant{\rm r}(AB). \]

例[8 复旦大学1999,武汉大学2001,厦门大学2001,北京理工大学2003,西安电子科技大学2004,浙江大学2007,北京大学2009,中南大学2010,兰州大学2020]
\(A,B,C\)分别是\(m\times n, n\times s, s\times t\)矩阵. 证明Frobenius不等式

\[{\rm r}(ABC)+{\rm r}(B)\geqslant {\rm r}(AB)+{\rm r}(BC). \]

证明 (方法一) 利用分块初等变换,考虑

\[\left(\begin{array}{cc} ABC&O\\ O& B \end{array}\right)\rightarrow \left(\begin{array}{cc} ABC&AB\\ O& B \end{array}\right)\rightarrow \left(\begin{array}{cc} O&AB\\ -BC& B \end{array}\right)\rightarrow \left(\begin{array}{cc} AB&O\\ B& BC \end{array}\right), \]

于是

\[\begin{array}{rl} {\rm r}(ABC)+{\rm r}(B)=&{\rm r}\left(\begin{array}{cc} ABC&O\\ O& B \end{array}\right) ={\rm r}\left(\begin{array}{cc} AB&O\\ B& BC \end{array}\right)\\ \geqslant& {\rm r}\left(\begin{array}{cc} AB&O\\ O& BC \end{array}\right) ={\rm r}(AB)+{\rm r}(BC). \end{array} \]

(方法二) 利用满秩分解与Sylvester不等式. 设\({\rm r}(B)=r\), 则存在行、列满秩矩阵\(H,L\)使得\(B=LH\). 则

\[\begin{aligned} {\rm r}(ABC)={\rm r}(ALHC)& \geqslant {\rm r}(AL)+{\rm r}(HC)-r\\ &\geqslant {\rm r}(AB)+{\rm r}(BC)-{\rm r}(B). \end{aligned} \]

下面的例子中, 由于\(A+B\)未必可逆,所以下面的一步使用的不是(广义)初等变换

\[\begin{pmatrix} A+B&\\ &E \end{pmatrix} \begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \xlongequal{\mbox{左乘}(A+B)} \begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix} \]

由于矩阵乘积的秩不大于每一个因子的秩,所以

\[{\rm r}\begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \geqslant \begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix} \]

例9 [武汉大学2008]
\(A,B\)是数域\(\mF\)上的\(n\)阶方阵,\(AB=BA\). 证明:
\({\rm r}(A+B)\leqslant {\rm r}(A)+{\rm r}(B)-{\rm r}(AB)\).

证明 (方法一) 利用线性方程组与维数公式,参见\ref{Sum-Product-rank}或\ref{Rank-dim}.

(方法二)
因为

\[\begin{aligned} \begin{pmatrix} A&O\\ O&B \end{pmatrix} &\rightarrow \begin{pmatrix} A&O\\ A&B \end{pmatrix} \rightarrow \begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \stackrel{\mbox{左乘}(A+B)}{\longrightarrow} \begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix}\\ &\rightarrow \begin{pmatrix} O&(A+B)A\\ -B&A+B \end{pmatrix} \rightarrow \begin{pmatrix} AB&O\\ -B&A+B \end{pmatrix} \end{aligned} \]

由于\(A+B\)未必可逆,所以左乘\(A+B\)不是初等变换,从而

\[\begin{aligned} {\rm r}(A)+{\rm r}(B)= &{\rm r}\begin{pmatrix} A&O\\ O&B \end{pmatrix} ={\rm r}\begin{pmatrix} A&A\\ A&A+B \end{pmatrix} \geqslant {\rm r}\begin{pmatrix} (A+B)A&(A+B)A\\ A&A+B \end{pmatrix}\\ =& {\rm r}\begin{pmatrix} AB&O\\ -B&A+B \end{pmatrix}\geqslant \begin{pmatrix} AB&O\\ O&A+B \end{pmatrix} ={\rm r}(AB)+{\rm r}(A+B). \end{aligned} \]

例10\(A,B\)\(m\times n, n\times m\)矩阵,证明

\[{\rm r}(A-ABA)={\rm r}(A)+{\rm r}(E_n-BA)-n. \]

证明 因为

\[\begin{aligned} \begin{pmatrix} A&O\\ O&E_n-BA \end{pmatrix} &\rightarrow \begin{pmatrix} A&O\\ BA&E_n-BA \end{pmatrix} \rightarrow \begin{pmatrix} A&A\\ BA&E_n \end{pmatrix}\\ &\rightarrow \begin{pmatrix} A-ABA&O\\ BA&E_n \end{pmatrix} \rightarrow \begin{pmatrix} A-ABA&O\\ O&E_n \end{pmatrix} \end{aligned} \]

所以

\[{\rm r}(A)+{\rm r}(E_n-BA)= {\rm r}\begin{pmatrix} A&O\\ O&E_n-BA \end{pmatrix}={\rm r} \begin{pmatrix} A-ABA&O\\ O&E_n \end{pmatrix}={\rm r}(A-ABA)+n. \]

\(\S2\) 由于矩阵的标准形(等价标准形、Jordan 标准形、Frobenius标准形)都是分块矩阵,因此运用标准形解决矩阵问题常常结合分块矩阵的方法.

例11\(A,B\)分别是复数域上的\(m,n\)阶矩阵,则\(A,B\)没有公共特征值当且仅当矩阵方程\(AX=XB\)只有零解.

** 证明**
必要性:(反证法)假设\(X_0\)\(AX=XB\)的非零解,设存在可逆矩阵\(P,Q\)使得

\[PX_0Q=\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}, r\geqslant 1. \]

\(AX_0=X_0B\)得到

\[(PAP^{-1})(PX_0Q)=(PX_0Q)(Q^{-1}BQ). \]

\[PAP^{-1}=\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}, Q^{-1}BQ=\begin{pmatrix} B_1&B_2\\ B_3&B_4\end{pmatrix}, \]

\[\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}=\begin{pmatrix} E_r&O\\ O&O\end{pmatrix} \begin{pmatrix} B_1&B_2\\ B_3&B_4 \end{pmatrix}, \]

\[\begin{pmatrix} A_1&O\\ A_3&O\end{pmatrix}= \begin{pmatrix} B_1&B_2\\ O&O\end{pmatrix}. \]

从而可得\(A_1=B_1, A_3=O, B_2=O\). 从而\(A_1=B_1\)的特征值是\(A,B\)的公共特征值,矛盾!所以\(AX=XB\)只有零解.

充分性:(反证法)假设\(\lambda_0\)\(A,B\)的公共特征值,因为\(f_B(\lambda)=f_{B^T}(\lambda)\), 所以\(\lambda_0\)也是\(A,B^T\)的公共特征值, 故存在可逆矩阵\(P,Q\)使得

\[P^{-1}AP =\begin{pmatrix} \lambda_0&A_2\\ 0&A_4\end{pmatrix}, Q^{-1}B^TQ=\begin{pmatrix} \lambda_0&B_2\\ 0&B_4\end{pmatrix}, \]

从而

\[A=P\begin{pmatrix} \lambda_0&A_2\\ 0&A_4\end{pmatrix}P^{-1}, B=(Q^T)^{-1} \begin{pmatrix} \lambda_0&0\\ B_2^T&B_4^T\end{pmatrix}Q^T. \]

\(X_0=P\begin{pmatrix} 1&0\\ 0&O\end{pmatrix}Q^T\ne O\), 则\(AX_)=X_0B\), 矛盾!所以\(A,B\)没有公共特征值.

该例的几何解法参见\ref{Comon-Eigen}. 该例的结论可用于解决如下问题:

1、\(A,B\)没有公共特征值\(\Leftrightarrow\) \((f_A(\lambda), f_B(\lambda))=1\) \(\Leftrightarrow\) \(f_B(A)\)可逆 \(\Leftrightarrow\) 矩阵方程\(AX=XB\)只有零解 \(\Leftrightarrow\)线性变换\(\sigma: \mathbb{C}^{m\times n}\rightarrow \mathbb{C}^{m\times n}, X\mapsto AX-XB\)可逆.

2、(中国科学技术大学,2013)设\(A,B\)\(n\)阶复方阵,\(\mathbb{C}^{n\times n}\)上的线性变换\(\A: X\mapsto AX-XB\). 证明:\(\A\)可逆的充分必要条件是\(A\)\(B\)无公共特征值.

3、(武汉大学,2013)设\(\lambda_1,\lambda_2,\cdots,\lambda_n\)\(n\)阶实方阵\(A\)的全部特征值,但\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值. 定义\(\mathbb{R}^{n\times n}\)的线性变换

\[\sigma(X)=A^TX+XA,\quad \forall X\in\mathbb{R}^{n\times n}. \]

证明:(1) \(\sigma\)是可逆线性变换;

(2) 对任意实对称矩阵\(C\), 存在唯一的实对称矩阵\(B\)使得\(A^TB+BA=C\).

证明
(1) 只需证明\(\sigma\)是单射. 设\(\sigma(X)=A^TX+XA=O\), 则\(XA=-A^TX\), 于是

\[f_A(-A^T)X=Xf_A(A)=O. \]

由于\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值, 所以\(f_A(-A^T)\)可逆,从而\(X=O\), \(\sigma\)是单射,从而是双射,故可逆.

(2) 由(1)知存在唯一的矩阵\(B\)使得\(\sigma(B)=C\). 由于

\[\sigma(B^T)=A^TB^T+B^TA=(A^TB+BA)^T=C^T=C, \]

所以\(B^T=B\), 即\(B\)是对称矩阵.

4、设\(A,B\)分别是\(m,n\)阶方阵,\(C\)\(m\times n\)阶矩阵. 证明:\(AX+XB=C\)有唯一解的充要条件是对\(A,B\)的任一特征值\(\lambda_i,\mu_j\), 都有\(\lambda_i+\mu_j\ne 0\).

(提示:只需证\(AX+XB=O\)只有零解当且仅当\(\lambda_i+\mu_j\ne 0\), 这等价于\(AX-XB=O\)只有零解当且仅当\(A,B\)没有公共特征值.)

矩阵方程\(AX-XB=C\)称为Sylvester方程,在控制理论中有着重要应用.

例12
\(A,B\)分别是复数域上的\(m,n\)阶矩阵,且\(A,B\)没有公共特征值,对任意的\(C\in\mathbb{C}^{m\times n}\), 若矩阵方程\(AX-XB=C\)有解,则有唯一解.

证明 (反证法) 假设矩阵方程\(AX-XB=C\)有两个不同的解\(X_1,X_2\), 则\(X_1-X_2\)矩阵方程\(AX-XB=O\)的非零解,与\ref{ComEigen-Equ} 矛盾!所以 矩阵方程\(AX-XB=C\)有唯一解.

[Roth第二定理]
矩阵方程\(AX-XB=C\)有解当且仅当\(\begin{pmatrix} A&C\\ O&B\end{pmatrix}\)\( \begin{pmatrix} A&O\\ O&B\end{pmatrix}\)相似,见\ref{SoluAX-XB=C}.

**例13 ** 设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,若\(A,B\)没有公共特征值,则\(D=\begin{pmatrix} A&C\\ O&B \end{pmatrix}\)可对角化当且仅当\(A,B\)可对角化.

** 证明** 因为\(A,B\)没有公共特征值,所以矩阵方程\(AX-XB=C\)有唯一解,设为\(X_0\). 由于

\[\begin{pmatrix} E&X_0\\ O&E \end{pmatrix}\begin{pmatrix} A&C\\ O&B \end{pmatrix} \begin{pmatrix} E&X_0\\ O&E \end{pmatrix}^{-1}= \begin{pmatrix} A&-AX_0+X_0B+C\\ O&B \end{pmatrix}= \begin{pmatrix} A&O\\ O&B \end{pmatrix}, \]

所以\(D\)可对角化当且仅当\(A,B\)可对角化.

例14\(A,B\)分别是复数域\(\mathbb{C}\)上的\(n\)阶与\(m\)阶矩阵, \(0<r\leqslant \min\{n,m\}\). 证明:如果\(AX-XB=O\)有秩为\(r\) 的矩阵解, 则\(A\)\(B\)至少有\(r\)个公共特征值(重根按重数计算).

证明\(C\)\(AX-XB=O\)的矩阵解, 且\({\rm r}(C)=r\). 则存在可逆矩阵\(P\in \mathbb{C}^{n\times n}\), \(Q\in \mathbb{C}^{m\times m}\), 使得

\[C=P\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)Q. \]

由于\(AC=CB\), 所以

\[AP\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)Q= P\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)QB,\]

从而

\[P^{-1}AP\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)QBQ^{-1}. \]

\(P^{-1}AP, QBQ^{-1}\)写成分块矩阵的形式

\[P^{-1}AP=\begin{pmatrix} A_{11}&A_{12}\\ A_{21}&A_{22}\end{pmatrix}, QBQ^{-1}=\begin{pmatrix} B_{11}&B_{12}\\ B_{21}&B_{22}\end{pmatrix} \]

\[\left(\begin{array}{cc} A_{11}&O\\ A_{21}&O\end{array}\right) =\left(\begin{array}{cc} B_{11}&B_{12}\\ O&O\end{array}\right). \]

由此得\(A_{11}=B_{11}, A_{21}=O, B_{12}=O\).
所以

\[P^{-1}AP=\left(\begin{array}{cc} A_{11}&A_{12}\\ O&A_{22}\end{array}\right),\quad QBQ^{-1}=\left(\begin{array}{cc} A_{11}&O\\ B_{12}&B_{22}\end{array}\right). \]

所以\(A,B\)的特征多项式分别为

\[f_A(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-A_{22}|,\quad f_B(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-B_{22}|. \]

它们有公因式\(|\lambda E_r-A_{11}|\), 因而\(A\)\(B\)至少有\(r\) 个公共特征值(重根按重数计算).

例15 [Roth第一定理]
\(A,B,C\)分别为\(m\times n\), \(n\times m\)\(n\times n\) 矩阵, 则\(\r\left(\begin{array}{cc} A&O\\O&B\end{array}\right) ={\rm r}\left(\begin{array}{cc} A&O\\ C&B\end{array}\right) \)的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=C\).

证明 \(\Longleftarrow\)\(\left(\begin{array}{cc} E&O\\ -X&E\end{array}\right) \left(\begin{array}{cc} A&O\\C&B\end{array}\right) \left(\begin{array}{cc} E&O\\ Y&E\end{array}\right) =\left(\begin{array}{cc} A&O\\O&B\end{array}\right) \)即得.

\(\Longrightarrow\)\(P_1AQ_1=\left(\begin{array}{cc} E_r&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_1,\; P_2BQ_2=\left(\begin{array}{cc} E_s&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_2. \)
\begin{equation}
\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\O&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cccc} E_r&&&\ &O&&\ &&E_s&\ &&&O\end{array}\right),
\end{equation}
\begin{equation}
\begin{array}{ll}
&\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\ C&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cc} P_1AQ_1&O\ P_2CQ_1&P_2BQ_2\end{array}\right)\
=&
\left(\begin{array}{cccc} E_r&O&&\ O&O&&\ D_1&D_2&E_s&O\ D_3&D_4&O&O\end{array}\right)
=\left(\begin{array}{cc} H_1&O\ D&H_2\end{array}\right).
\end{array}
\end{equation}
从(2.5)中消去\(D_1\), 即

\[\left(\begin{array}{cccc} E_r&&&\\ O&E&&\\ -D_1&O&E_s&O\\ O&O&O&E\end{array}\right) \left(\begin{array}{cccc} E_r&O&&\\ O&O&&\\ D_1&D_2&E_s&O\\ D_3&D_4&O&O\end{array}\right) = \left(\begin{array}{cccc} E_r&O&&\\ O&O&&\\ O&D_2&E_s&O\\ D_3&D_4&O&O\end{array}\right). \]

此过程可简记为

\[\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right) \left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} D_1&D_2\\ D_3&D_4\end{array}\right) = \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right). \]

继续消去\(D_3,D_2\)的过程可简记为

\[\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right) \left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right) = \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right). \]

\[\left(\begin{array}{cc} E_s&O\\ O&O\end{array}\right)\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right) = \left(\begin{array}{cc} O&O\\ O&D_4\end{array}\right). \]

由题设, (2.4)与(2.5)式右端的秩相等, 所以\(D_4=O\). 从而该消去过程相当于存在矩阵\(U=\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right)+\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right),V=\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)\)使得

\[UH_1+H_2V+D=O. \]

\[U(P_1AQ_1)+(P_2BQ_2)V=-P_2CQ_1, \]

或等价地,

\[(-P_2^{-1}UP_1)A-B(Q_2VQ_1^{-1})=C. \]

\(X=-P_2^{-1}UP_1\), \(Y=Q_2VQ_1^{-1}\), 即证.

例16\(A,B\)分别为\(m\times n\)\(n\times m\)矩阵, 则\({\rm r}(A)+{\rm r}(B)={\rm r}(AB)+n\) 的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=E_n\).

证明 由Sylvester不等式的证明过程知只需证明

\[{\rm r}\left(\begin{array}{cc} A&O\\O&B\end{array}\right) ={\rm r}\left(\begin{array}{cc} A&O\\ E&B\end{array}\right) \Longleftrightarrow \exists X,Y, \mbox{s.t.} XA-BY=E_n. \]

这由上题即得.

\(\S3\) 通过构造分块矩阵,再利用广义初等变换将其化为分块上(下)三角矩阵是解决行列式等式的常用方法.

例17\(A\,,\,B\,,\,C\,,\,D\)\(n\)阶方阵, \(|A|\ne 0\). 证明

(1) 若\(AC=CA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|AD-CB|\,;\)

(2) 若 \(AB=BA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|DA-CB|\,.\)

证明 (1),若\(A\)可逆, 则
\begin{eqnarray}\begin{pmatrix}E&O\-A^{-1}C&E\end{pmatrix}\begin{pmatrix}A&B\C&D\end{pmatrix}&=&\begin{pmatrix}A&B\
-A{-1}CA+C&-ACB+D\end{pmatrix}$$12pt]
&\begin{tabular}{c}
\(\mbox{\scriptsize{AC=CA}}\)\
\hline\hline
\end{tabular}&\begin{pmatrix}A&B\O&-A^{-1}CB+D\end{pmatrix},,\end{eqnarray
}
故$$\begin{vmatrix}A&B\C&D\end{vmatrix}=|A||-A^{-1}CB+D|=|AD-CB|,.$$

(2) 类似可证.

例18 [中国科学院大学2010]
\(A, B\)分别是\(n\times m\)\(m\times n\) 矩阵. 证明

\[|E_n-AB|=\begin{vmatrix}E_m&B\\ A&E_n\end{vmatrix}=|E_m-BA|. \]

证明 一方面,

\[\begin{pmatrix}E&O\\-A&E\end{pmatrix} \begin{pmatrix}E_m&B\\A&E_n\end{pmatrix} = \begin{pmatrix}E_m&B\\ O&E_n-AB\end{pmatrix} \]

故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m||E_n-AB|=|E_n-AB|,.$$
另一方面,

\[\begin{pmatrix}E&-B\\O&E\end{pmatrix} \begin{pmatrix}E_m&B\\A&E_n\end{pmatrix} = \begin{pmatrix}E_m-BA&O\\ O&E_n\end{pmatrix} \]

故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m-BA||E_n|=|E_m-BA|,.$$
所以

\[|E_n-AB|=\begin{vmatrix}E_m&B\\ A&E_n\end{vmatrix}=|E_m-BA|. \]

[上海交通大学2005]
\(A,B\)\(n\)阶方阵,满足
\({\rm r}(E-AB)+{\rm r}(E+BA)=n\). 求证:\({\rm r}(A)=n\).

(提示: 先证\({\rm r}(E+BA)={\rm r}(E+AB)\), 从而\({\rm r}(E-AB)+{\rm r}(E+AB)=n\), 故\((AB)^2=E\), \(A\)可逆从而\({\rm r}(A)=n\), 参见\ref{Rank-AB-BA})
\end{remark}

下面的例子称为特征多项式的降阶公式.

例19 [上海大学2012]
\(A, B\)分别是\(n\times m\)\(m\times n\) 矩阵, \(\lambda\ne 0\). 证明

\[|\lambda E_n-AB|=\lambda^{n-m}|\lambda E_m-BA|. \]

*证明 一方面,

\[\begin{pmatrix}E_n&O\\-\lambda^{-1} A&E\end{pmatrix} \begin{pmatrix}\lambda E_m&B\\ A& E_n\end{pmatrix} = \begin{pmatrix}\lambda E_m&B\\ O&E_n-\lambda^{-1} AB\end{pmatrix} \]

故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m||E_n-\lambda{-1}AB|=\lambda |\lambda E_n-AB|,.$$
另一方面,

\[\begin{pmatrix}E&-B\\O&E\end{pmatrix} \begin{pmatrix}\lambda E_m&B\\A&E_n\end{pmatrix} = \begin{pmatrix}\lambda E_m-BA&O\\ O&E_n\end{pmatrix} \]

故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m-BA||E_n|=|\lambda E_m-BA|,.$$
所以

\[ |\lambda E_n-AB|=\lambda^{n-m} |\lambda E_m-BA|. \]