分块矩阵法是高等代数中处理矩阵相关问题的最重要的方法之一, 其重要性可以说怎么强调都不过分. 分块矩阵法的核心思想是根据具体问题构造适当的分块矩阵, 然后运用广义初等变换, 将某些子块消为零块, 得到特殊的分块矩阵从而解决问题. 该方法几乎贯穿了线性代数的始终, 在矩阵求逆、矩阵秩不等式、行列式、线性方程组、线性变换、二次型等方面有着广泛的应用.
分块矩阵法是高等代数中处理矩阵相关问题的最重要的方法之一, 其重要性可以说怎么强调都不过分. 分块矩阵法的核心思想是根据具体问题构造适当的分块矩阵, 然后运用广义初等变换, 将某些子块消为零块, 得到特殊的分块矩阵从而解决问题. 该方法几乎贯穿了线性代数的始终, 在矩阵求逆、矩阵秩不等式、行列式、线性方程组、线性变换、二次型等方面有着广泛的应用.
例如, 证明行列式的乘法公式\(|AB|=|A|\cdot |B|\)时, 我们就构造了分块矩阵
\[\left(\begin{array}{cc}
A&O \\ -E& B
\end{array}\right).
\]
作广义初等变换
\[\left(\begin{array}{cc}
A&O \\ -E& B
\end{array}\right)
\stackrel{c_1\cdot B+c_2}{\longrightarrow}
\left(\begin{array}{cc}
A&AB \\ -E& O
\end{array}\right)
\stackrel{r_1\leftrightarrow r_2}{\longrightarrow}
\left(\begin{array}{cc}
-E& O\\ A&AB
\end{array}\right).
\]
取行列式, 得
\[|A|\cdot |B|=\left|\begin{array}{cc}
A&O \\ -E& B
\end{array}\right|=(-1)^n
\left|\begin{array}{cc}
-E& O\\ A&AB
\end{array}\right|=(-1)^n|-E_n|\cdot |AB|,
\]
即\(|AB|=|A|\cdot |B|\).
再例如, 若子矩阵块\(A\)可逆,利用初等变换将分块矩阵\(\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)\)
的子块\(C\)消成\(O\), 即
\[\left(\begin{array}{cc}
A&B\\ C& D
\end{array}\right)
\stackrel{r_1\cdot -CA^{-1}+r_2}{\longrightarrow}
\left(\begin{array}{cc}
A&B \\ O& D-CA^{-1}B
\end{array}\right).
\]
得到行列式
\[\left|\begin{array}{cc}
A&B\\ C& D
\end{array}\right|
=\left|\begin{array}{cc}
A&B \\ O& D-CA^{-1}B
\end{array}\right|=|A|\cdot|D-CA^{-1}B|.
\]
该式有时也称为行列式的降阶公式.
\(\S1\) 由于广义初等变换不改变矩阵的秩,所以 关于矩阵秩的等式或不等式的证明, 分块矩阵法可以大显神通. 使用该方法的主要思路是根据等式或不等式的一边,利用下面例2中的等式或不等式,构造合适的分块矩阵,对其实施分块矩阵的初等变换,得到等式或不等式的另一边的秩关系.
例1 设\(A_{m\times n}\,,\,B_{n\times
l}\), 则\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).
证明 由于
\[(A,\; AB)\left(\begin{array}{cc} E&-B\\ O&E \end{array}\right)= (A,\; O),\quad
\left(\begin{array}{cc} E&O\\ -A&E \end{array}\right)
\left(\begin{array}{c} B\\ AB \end{array}\right)
=\left(\begin{array}{c} B\\ O \end{array}\right),
\]
所以
\[\begin{array}{c}
{\rm r}(AB)\leqslant {\rm r}(A,\; AB)={\rm r}(A,\; O)={\rm r}(A),\;\\
{\rm r}(AB)\leqslant {\rm r}\left(\begin{array}{c} B\\ AB \end{array}\right)={\rm r}\left(\begin{array}{c} B\\ O \end{array}\right)={\rm r}(B),
\end{array}
\]
即\({\rm r}(AB)\leqslant \min\{{\rm r}(A),{\rm r}(B)\}\).
例2 \({\rm r}(A)+{\rm r}(B)={\rm r}\begin{pmatrix}A&O\\O&B \end{pmatrix}\leqslant
{\rm r}\begin{pmatrix}A&O\\C&B\end{pmatrix}\,\).
证明 设\({\rm r}(A)=r_1\), \({\rm r}(B)=r_2\), 则存在可逆矩阵\(P_1,Q_1\) 与\(P_2, Q_2\) 使得
\[P_1AQ_1=\begin{pmatrix}E_{r_1}&\\ &O\end{pmatrix}, \qquad P_2BQ_2=\begin{pmatrix}E_{r_2}&\\ &O\end{pmatrix}.
\]
从而
\[\begin{pmatrix}P_1&\\ &P_2\end{pmatrix}
\begin{pmatrix}A&\\ &B\end{pmatrix}
\begin{pmatrix}Q_1&\\ &Q_2\end{pmatrix}
=\left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline &&E_{r_2}&\\ &&&O\end{array}\right).
\]
所以由(1)得
\[{\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}=r_1+r_2={\rm r}(A)+{\rm r}(B).
\]
另一方面, 由于通过初等变换,
\[\begin{array}{rl}
&\begin{pmatrix}A&O\\ C&B\end{pmatrix}\rightarrow
\left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline D_{11}&D_{12}&E_{r_2}&\\ D_{21}&D_{22}&&O\end{array}\right)\\
\rightarrow &
\left(\begin{array}{cc|cc}E_{r_1}&&&\\&O&&\\ \hline O&O&E_{r_2}&\\ O&D&&O\end{array}\right)\rightarrow
\left(\begin{array}{cccc}E_{r_1}&&&\\ &E_{r_2}&&\\ &&D&\\&&&O\end{array}\right),
\end{array}
\]
所以
\[{\rm r}\begin{pmatrix}A&O\\ C&B\end{pmatrix}=r_1+r_2+{\rm r}(D)\geqslant r_1+r_2={\rm r}(A)+{\rm r}(B).
\]
例3 若\(A,B\)是同阶矩阵,则
\(|{\rm r}(A)-{\rm r}(B)|\leqslant {\rm r}(A\pm B)\leqslant
{\rm r}(A)+{\rm r}(B)\).
证明 由于
\[\begin{pmatrix}A&\\ &B\end{pmatrix}\rightarrow
\begin{pmatrix}A&O\\ A&B\end{pmatrix}\rightarrow
\begin{pmatrix}A&A\\ A&A+B\end{pmatrix},
\]
所以
\[{\rm r}(A+B)\leqslant {\rm r}\begin{pmatrix}A&A\\ A&A+B\end{pmatrix}
={\rm r}\begin{pmatrix}A&\\ &B\end{pmatrix}={\rm r}(A)+{\rm r}(B).
\]
另一方面, 不妨设\({\rm r}(A)\geqslant {\rm r}(B)\), 则由
\[\begin{pmatrix}A+B&\\ &B\end{pmatrix}\rightarrow
\begin{pmatrix}A+B&B\\ O&B\end{pmatrix}\rightarrow
\begin{pmatrix}A&B\\ -B&B\end{pmatrix},
\]
可得
\[{\rm r}(A)\leqslant {\rm r}\begin{pmatrix}A&B\\ -B&B\end{pmatrix}
={\rm r}\begin{pmatrix}A+B&\\ &B\end{pmatrix}
={\rm r}(A+B)+{\rm r}(B),
\]
即
\[{\rm r}(A)-{\rm r}(B)\leqslant {\rm r}(A+B).
\]
而且,
\[{\rm r}(A)={\rm r}(A-B+B)\leqslant{\rm r}(A-B)+{\rm r}(B)\,,
\]
所以 \({\rm r}(A)-{\rm r}(B)\leqslant{\rm r}(A-B)\),.
类似地,
\[{\rm r}(B)-{\rm r}(A)\leqslant{\rm r}(B-A)={\rm r}(A-B)\,.
\]
所以
\(|{\rm r}(A)-{\rm r}(B)|\leqslant{\rm r}(A-B)\),,
故
\[|{\rm r}(A)-{\rm r}(B)|\leqslant{\rm r}(A\pm B)\,.
\]
例4 [第一降阶定理]
设\(A\)是可逆矩阵, \(\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)\)是\((r,m-r)\times (r,m-r)\)分块矩阵. 证明\({\rm r}\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B)\).
证明 因为
\[\left(\begin{array}{cc}
E_r&O \\ -CA^{-1}& E_{m-r}
\end{array}\right)
\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)
\left(\begin{array}{cc}
E_r&-A^{-1}B \\ O& E_{m-r}
\end{array}\right)=
\left(\begin{array}{cc}
A&O \\ O& D-CA^{-1}B
\end{array}\right),
\]
且\(\left(\begin{array}{cc}
E_r&O \\ -CA^{-1}& E_{m-r}
\end{array}\right)\)与\(\left(\begin{array}{cc}
E_r&-A^{-1}B \\ O& E_{m-r}
\end{array}\right)\)都是非异矩阵, 所以
\[{\rm r}\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B).
\]
例5 [第二降阶定理]
设\(A,D\)分别是\(r,s\)阶非奇异矩阵, \(B\in F^{r\times s}\), \(C\in F^{s\times r}\), 则
\[{\rm r}(D-CA^{-1}B)={\rm r}(D)-{\rm r}(A)+{\rm r}(A-BD^{-1}C).
\]
证明 由第一讲解定理得
\[{\rm r}\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)={\rm r}(A)+{\rm r}(D-CA^{-1}B).
\]
另一方面, 由\(D\)非奇异知
\[\left(\begin{array}{cc}
E_r&-BD^{-1} \\ O& E_{m-r}
\end{array}\right)
\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)
\left(\begin{array}{cc}
E_r&O \\ -D^{-1}C& E_{m-r}
\end{array}\right)=
\left(\begin{array}{cc}
A-BD^{-1}C&O \\ O& D
\end{array}\right),
\]
所以
\[{\rm r}\left(\begin{array}{cc}
A&B \\ C& D
\end{array}\right)={\rm r}(D)+{\rm r}(A-BD^{-1}C).
\]
故
\[{\rm r}(D-CA^{-1}B)={\rm r}(D)-{\rm r}(A)+{\rm r}(A-BD^{-1}C).
\]
例6 设\(A\)是\(m\times n\)矩阵, 证明
\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n.
\]
*证明 由\ref{No.2-RedOrder}知
\[\begin{array}{rl}
{\rm r}(E_m-AA^T)={\rm r}(E_m-AE_nA^T)&={\rm r}(E_m)-{\rm r}(E_n)+{\rm r}(E_n-A^TE_mA)\\
&=m-n+{\rm r}(E_n-A^TA).
\end{array}
\]
即
\[{\rm r}(E_m-AA^T)-{\rm r}(E_n-A^TA)=m-n.
\]
例7 [Sylvester不等式]
设\(A,B\)为\(n\)阶方阵,则\({\rm r}(A)+{\rm r}(B)\leqslant
{\rm r}(AB)+n\).
** 证明** 对分块矩阵作广义初等变换, $$\begin{pmatrix}A&O\E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&B\end{pmatrix}\rightarrow\begin{pmatrix}O&-AB\
E&O\end{pmatrix}\rightarrow\begin{pmatrix}E&O\O&AB\end{pmatrix},.$$
由(3)得
\[{\rm r}(A)+{\rm r}(B)\leqslant{\rm r}\begin{pmatrix}A&O\\
E&B\end{pmatrix}={\rm r}\begin{pmatrix}E&O\\
O&AB\end{pmatrix}={\rm r}(AB)+n,\]
即
\[{\rm r}(A)+{\rm r}(B)-n\leqslant{\rm r}(AB).
\]
例[8 复旦大学1999,武汉大学2001,厦门大学2001,北京理工大学2003,西安电子科技大学2004,浙江大学2007,北京大学2009,中南大学2010,兰州大学2020]
设\(A,B,C\)分别是\(m\times n, n\times s, s\times t\)矩阵. 证明Frobenius不等式
\[{\rm r}(ABC)+{\rm r}(B)\geqslant {\rm r}(AB)+{\rm r}(BC).
\]
证明 (方法一) 利用分块初等变换,考虑
\[\left(\begin{array}{cc}
ABC&O\\ O& B
\end{array}\right)\rightarrow
\left(\begin{array}{cc}
ABC&AB\\ O& B
\end{array}\right)\rightarrow
\left(\begin{array}{cc}
O&AB\\ -BC& B
\end{array}\right)\rightarrow
\left(\begin{array}{cc}
AB&O\\ B& BC
\end{array}\right),
\]
于是
\[\begin{array}{rl}
{\rm r}(ABC)+{\rm r}(B)=&{\rm r}\left(\begin{array}{cc}
ABC&O\\ O& B
\end{array}\right)
={\rm r}\left(\begin{array}{cc}
AB&O\\ B& BC
\end{array}\right)\\
\geqslant&
{\rm r}\left(\begin{array}{cc}
AB&O\\ O& BC
\end{array}\right)
={\rm r}(AB)+{\rm r}(BC).
\end{array}
\]
(方法二) 利用满秩分解与Sylvester不等式. 设\({\rm r}(B)=r\), 则存在行、列满秩矩阵\(H,L\)使得\(B=LH\). 则
\[\begin{aligned}
{\rm r}(ABC)={\rm r}(ALHC)& \geqslant {\rm r}(AL)+{\rm r}(HC)-r\\
&\geqslant {\rm r}(AB)+{\rm r}(BC)-{\rm r}(B).
\end{aligned}
\]
下面的例子中, 由于\(A+B\)未必可逆,所以下面的一步使用的不是(广义)初等变换
\[\begin{pmatrix}
A+B&\\ &E
\end{pmatrix}
\begin{pmatrix}
A&A\\ A&A+B
\end{pmatrix}
\xlongequal{\mbox{左乘}(A+B)}
\begin{pmatrix}
(A+B)A&(A+B)A\\ A&A+B
\end{pmatrix}
\]
由于矩阵乘积的秩不大于每一个因子的秩,所以
\[{\rm r}\begin{pmatrix}
A&A\\ A&A+B
\end{pmatrix}
\geqslant
\begin{pmatrix}
(A+B)A&(A+B)A\\ A&A+B
\end{pmatrix}
\]
例9 [武汉大学2008]
设\(A,B\)是数域\(\mF\)上的\(n\)阶方阵,\(AB=BA\). 证明:
\({\rm r}(A+B)\leqslant {\rm r}(A)+{\rm r}(B)-{\rm r}(AB)\).
证明 (方法一) 利用线性方程组与维数公式,参见\ref{Sum-Product-rank}或\ref{Rank-dim}.
(方法二)
因为
\[\begin{aligned}
\begin{pmatrix}
A&O\\ O&B
\end{pmatrix}
&\rightarrow
\begin{pmatrix}
A&O\\ A&B
\end{pmatrix}
\rightarrow
\begin{pmatrix}
A&A\\ A&A+B
\end{pmatrix}
\stackrel{\mbox{左乘}(A+B)}{\longrightarrow}
\begin{pmatrix}
(A+B)A&(A+B)A\\ A&A+B
\end{pmatrix}\\
&\rightarrow
\begin{pmatrix}
O&(A+B)A\\ -B&A+B
\end{pmatrix}
\rightarrow
\begin{pmatrix}
AB&O\\ -B&A+B
\end{pmatrix}
\end{aligned}
\]
由于\(A+B\)未必可逆,所以左乘\(A+B\)不是初等变换,从而
\[\begin{aligned}
{\rm r}(A)+{\rm r}(B)= &{\rm r}\begin{pmatrix}
A&O\\ O&B
\end{pmatrix}
={\rm r}\begin{pmatrix}
A&A\\ A&A+B
\end{pmatrix}
\geqslant
{\rm r}\begin{pmatrix}
(A+B)A&(A+B)A\\ A&A+B
\end{pmatrix}\\
=&
{\rm r}\begin{pmatrix}
AB&O\\ -B&A+B
\end{pmatrix}\geqslant
\begin{pmatrix}
AB&O\\ O&A+B
\end{pmatrix}
={\rm r}(AB)+{\rm r}(A+B).
\end{aligned}
\]
例10 设\(A,B\)是\(m\times n, n\times m\)矩阵,证明
\[{\rm r}(A-ABA)={\rm r}(A)+{\rm r}(E_n-BA)-n.
\]
证明 因为
\[\begin{aligned}
\begin{pmatrix}
A&O\\ O&E_n-BA
\end{pmatrix}
&\rightarrow
\begin{pmatrix}
A&O\\ BA&E_n-BA
\end{pmatrix}
\rightarrow
\begin{pmatrix}
A&A\\ BA&E_n
\end{pmatrix}\\
&\rightarrow
\begin{pmatrix}
A-ABA&O\\ BA&E_n
\end{pmatrix}
\rightarrow
\begin{pmatrix}
A-ABA&O\\ O&E_n
\end{pmatrix}
\end{aligned}
\]
所以
\[{\rm r}(A)+{\rm r}(E_n-BA)=
{\rm r}\begin{pmatrix}
A&O\\ O&E_n-BA
\end{pmatrix}={\rm r}
\begin{pmatrix}
A-ABA&O\\ O&E_n
\end{pmatrix}={\rm r}(A-ABA)+n.
\]
\(\S2\) 由于矩阵的标准形(等价标准形、Jordan 标准形、Frobenius标准形)都是分块矩阵,因此运用标准形解决矩阵问题常常结合分块矩阵的方法.
例11 设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,则\(A,B\)没有公共特征值当且仅当矩阵方程\(AX=XB\)只有零解.
** 证明**
必要性:(反证法)假设\(X_0\)是\(AX=XB\)的非零解,设存在可逆矩阵\(P,Q\)使得
\[PX_0Q=\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}, r\geqslant 1.
\]
由\(AX_0=X_0B\)得到
\[(PAP^{-1})(PX_0Q)=(PX_0Q)(Q^{-1}BQ).
\]
设
\[PAP^{-1}=\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}, Q^{-1}BQ=\begin{pmatrix} B_1&B_2\\ B_3&B_4\end{pmatrix},
\]
则
\[\begin{pmatrix} A_1&A_2\\ A_3&A_4\end{pmatrix}\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}=\begin{pmatrix} E_r&O\\ O&O\end{pmatrix}
\begin{pmatrix} B_1&B_2\\ B_3&B_4 \end{pmatrix},
\]
即
\[\begin{pmatrix} A_1&O\\ A_3&O\end{pmatrix}=
\begin{pmatrix} B_1&B_2\\ O&O\end{pmatrix}.
\]
从而可得\(A_1=B_1, A_3=O, B_2=O\). 从而\(A_1=B_1\)的特征值是\(A,B\)的公共特征值,矛盾!所以\(AX=XB\)只有零解.
充分性:(反证法)假设\(\lambda_0\)是\(A,B\)的公共特征值,因为\(f_B(\lambda)=f_{B^T}(\lambda)\), 所以\(\lambda_0\)也是\(A,B^T\)的公共特征值, 故存在可逆矩阵\(P,Q\)使得
\[P^{-1}AP =\begin{pmatrix}
\lambda_0&A_2\\
0&A_4\end{pmatrix},
Q^{-1}B^TQ=\begin{pmatrix}
\lambda_0&B_2\\
0&B_4\end{pmatrix},
\]
从而
\[A=P\begin{pmatrix}
\lambda_0&A_2\\
0&A_4\end{pmatrix}P^{-1}, B=(Q^T)^{-1} \begin{pmatrix}
\lambda_0&0\\
B_2^T&B_4^T\end{pmatrix}Q^T.
\]
令\(X_0=P\begin{pmatrix}
1&0\\
0&O\end{pmatrix}Q^T\ne O\), 则\(AX_)=X_0B\), 矛盾!所以\(A,B\)没有公共特征值.
注 该例的几何解法参见\ref{Comon-Eigen}. 该例的结论可用于解决如下问题:
1、\(A,B\)没有公共特征值\(\Leftrightarrow\) \((f_A(\lambda), f_B(\lambda))=1\) \(\Leftrightarrow\) \(f_B(A)\)可逆 \(\Leftrightarrow\) 矩阵方程\(AX=XB\)只有零解 \(\Leftrightarrow\)线性变换\(\sigma: \mathbb{C}^{m\times n}\rightarrow \mathbb{C}^{m\times n}, X\mapsto AX-XB\)可逆.
2、(中国科学技术大学,2013)设\(A,B\)是\(n\)阶复方阵,\(\mathbb{C}^{n\times n}\)上的线性变换\(\A: X\mapsto AX-XB\). 证明:\(\A\)可逆的充分必要条件是\(A\)和\(B\)无公共特征值.
3、(武汉大学,2013)设\(\lambda_1,\lambda_2,\cdots,\lambda_n\)是\(n\)阶实方阵\(A\)的全部特征值,但\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值. 定义\(\mathbb{R}^{n\times n}\)的线性变换
\[\sigma(X)=A^TX+XA,\quad \forall X\in\mathbb{R}^{n\times n}.
\]
证明:(1) \(\sigma\)是可逆线性变换;
(2) 对任意实对称矩阵\(C\), 存在唯一的实对称矩阵\(B\)使得\(A^TB+BA=C\).
证明
(1) 只需证明\(\sigma\)是单射. 设\(\sigma(X)=A^TX+XA=O\), 则\(XA=-A^TX\), 于是
\[f_A(-A^T)X=Xf_A(A)=O.
\]
由于\(-\lambda_i(i=1,2,\cdots,n)\)不是\(A\)的特征值, 所以\(f_A(-A^T)\)可逆,从而\(X=O\), \(\sigma\)是单射,从而是双射,故可逆.
(2) 由(1)知存在唯一的矩阵\(B\)使得\(\sigma(B)=C\). 由于
\[\sigma(B^T)=A^TB^T+B^TA=(A^TB+BA)^T=C^T=C,
\]
所以\(B^T=B\), 即\(B\)是对称矩阵.
4、设\(A,B\)分别是\(m,n\)阶方阵,\(C\)是\(m\times n\)阶矩阵. 证明:\(AX+XB=C\)有唯一解的充要条件是对\(A,B\)的任一特征值\(\lambda_i,\mu_j\), 都有\(\lambda_i+\mu_j\ne 0\).
(提示:只需证\(AX+XB=O\)只有零解当且仅当\(\lambda_i+\mu_j\ne 0\), 这等价于\(AX-XB=O\)只有零解当且仅当\(A,B\)没有公共特征值.)
矩阵方程\(AX-XB=C\)称为Sylvester方程,在控制理论中有着重要应用.
例12
设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,且\(A,B\)没有公共特征值,对任意的\(C\in\mathbb{C}^{m\times n}\), 若矩阵方程\(AX-XB=C\)有解,则有唯一解.
证明 (反证法) 假设矩阵方程\(AX-XB=C\)有两个不同的解\(X_1,X_2\), 则\(X_1-X_2\)矩阵方程\(AX-XB=O\)的非零解,与\ref{ComEigen-Equ} 矛盾!所以 矩阵方程\(AX-XB=C\)有唯一解.
注[Roth第二定理]
矩阵方程\(AX-XB=C\)有解当且仅当\(\begin{pmatrix} A&C\\ O&B\end{pmatrix}\)与\(
\begin{pmatrix} A&O\\ O&B\end{pmatrix}\)相似,见\ref{SoluAX-XB=C}.
**例13 ** 设\(A,B\)分别是复数域上的\(m,n\)阶矩阵,若\(A,B\)没有公共特征值,则\(D=\begin{pmatrix} A&C\\ O&B \end{pmatrix}\)可对角化当且仅当\(A,B\)可对角化.
** 证明** 因为\(A,B\)没有公共特征值,所以矩阵方程\(AX-XB=C\)有唯一解,设为\(X_0\). 由于
\[\begin{pmatrix} E&X_0\\ O&E \end{pmatrix}\begin{pmatrix} A&C\\ O&B \end{pmatrix}
\begin{pmatrix} E&X_0\\ O&E \end{pmatrix}^{-1}=
\begin{pmatrix} A&-AX_0+X_0B+C\\ O&B \end{pmatrix}=
\begin{pmatrix} A&O\\ O&B \end{pmatrix},
\]
所以\(D\)可对角化当且仅当\(A,B\)可对角化.
例14 设\(A,B\)分别是复数域\(\mathbb{C}\)上的\(n\)阶与\(m\)阶矩阵, \(0<r\leqslant \min\{n,m\}\). 证明:如果\(AX-XB=O\)有秩为\(r\) 的矩阵解, 则\(A\) 与\(B\)至少有\(r\)个公共特征值(重根按重数计算).
证明 设\(C\)是\(AX-XB=O\)的矩阵解, 且\({\rm r}(C)=r\). 则存在可逆矩阵\(P\in \mathbb{C}^{n\times n}\), \(Q\in \mathbb{C}^{m\times m}\), 使得
\[C=P\left(\begin{array}{cc}
E_r&O\\ O&O\end{array}\right)Q.
\]
由于\(AC=CB\), 所以
\[AP\left(\begin{array}{cc}
E_r&O\\ O&O\end{array}\right)Q=
P\left(\begin{array}{cc}
E_r&O\\ O&O\end{array}\right)QB,\]
从而
\[P^{-1}AP\left(\begin{array}{cc}
E_r&O\\ O&O\end{array}\right)=\left(\begin{array}{cc}
E_r&O\\ O&O\end{array}\right)QBQ^{-1}.
\]
将\(P^{-1}AP, QBQ^{-1}\)写成分块矩阵的形式
\[P^{-1}AP=\begin{pmatrix}
A_{11}&A_{12}\\
A_{21}&A_{22}\end{pmatrix},
QBQ^{-1}=\begin{pmatrix}
B_{11}&B_{12}\\
B_{21}&B_{22}\end{pmatrix}
\]
故
\[\left(\begin{array}{cc}
A_{11}&O\\ A_{21}&O\end{array}\right)
=\left(\begin{array}{cc}
B_{11}&B_{12}\\ O&O\end{array}\right).
\]
由此得\(A_{11}=B_{11}, A_{21}=O, B_{12}=O\).
所以
\[P^{-1}AP=\left(\begin{array}{cc}
A_{11}&A_{12}\\ O&A_{22}\end{array}\right),\quad
QBQ^{-1}=\left(\begin{array}{cc}
A_{11}&O\\ B_{12}&B_{22}\end{array}\right).
\]
所以\(A,B\)的特征多项式分别为
\[f_A(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-A_{22}|,\quad
f_B(\lambda)=|\lambda E_r-A_{11}|\cdot |\lambda E-B_{22}|.
\]
它们有公因式\(|\lambda E_r-A_{11}|\), 因而\(A\) 与\(B\)至少有\(r\) 个公共特征值(重根按重数计算).
例15 [Roth第一定理]
设\(A,B,C\)分别为\(m\times n\), \(n\times m\)与\(n\times n\) 矩阵, 则\(\r\left(\begin{array}{cc} A&O\\O&B\end{array}\right)
={\rm r}\left(\begin{array}{cc} A&O\\ C&B\end{array}\right)
\)的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=C\).
证明 \(\Longleftarrow\) 由\(\left(\begin{array}{cc} E&O\\ -X&E\end{array}\right) \left(\begin{array}{cc} A&O\\C&B\end{array}\right)
\left(\begin{array}{cc} E&O\\ Y&E\end{array}\right)
=\left(\begin{array}{cc} A&O\\O&B\end{array}\right)
\)即得.
\(\Longrightarrow\) 设\(P_1AQ_1=\left(\begin{array}{cc} E_r&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_1,\; P_2BQ_2=\left(\begin{array}{cc} E_s&O\\O&O\end{array}\right)\stackrel{\Delta}{=}H_2.
\) 则
\begin{equation}
\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\O&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cccc} E_r&&&\ &O&&\ &&E_s&\ &&&O\end{array}\right),
\end{equation}
\begin{equation}
\begin{array}{ll}
&\left(\begin{array}{cc} P_1&O\O&P_2\end{array}\right)
\left(\begin{array}{cc} A&O\ C&B\end{array}\right)
\left(\begin{array}{cc} Q_1&O\O&Q_2\end{array}\right)
=\left(\begin{array}{cc} P_1AQ_1&O\ P_2CQ_1&P_2BQ_2\end{array}\right)\
=&
\left(\begin{array}{cccc} E_r&O&&\ O&O&&\ D_1&D_2&E_s&O\ D_3&D_4&O&O\end{array}\right)
=\left(\begin{array}{cc} H_1&O\ D&H_2\end{array}\right).
\end{array}
\end{equation}
从(2.5)中消去\(D_1\), 即
\[\left(\begin{array}{cccc} E_r&&&\\ O&E&&\\ -D_1&O&E_s&O\\ O&O&O&E\end{array}\right)
\left(\begin{array}{cccc} E_r&O&&\\ O&O&&\\ D_1&D_2&E_s&O\\ D_3&D_4&O&O\end{array}\right)
=
\left(\begin{array}{cccc} E_r&O&&\\ O&O&&\\ O&D_2&E_s&O\\ D_3&D_4&O&O\end{array}\right).
\]
此过程可简记为
\[\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right)
\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} D_1&D_2\\ D_3&D_4\end{array}\right)
= \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right).
\]
继续消去\(D_3,D_2\)的过程可简记为
\[\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right)
\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ D_3&D_4\end{array}\right)
= \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right).
\]
\[\left(\begin{array}{cc} E_s&O\\ O&O\end{array}\right)\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)+ \left(\begin{array}{cc} O&D_2\\ O&D_4\end{array}\right)
= \left(\begin{array}{cc} O&O\\ O&D_4\end{array}\right).
\]
由题设, (2.4)与(2.5)式右端的秩相等, 所以\(D_4=O\). 从而该消去过程相当于存在矩阵\(U=\left(\begin{array}{cc} O&O\\ -D_3&O\end{array}\right)+\left(\begin{array}{cc} -D_1&O\\ O&O\end{array}\right),V=\left(\begin{array}{cc} O&-D_2\\ O&O\end{array}\right)\)使得
\[UH_1+H_2V+D=O.
\]
即
\[U(P_1AQ_1)+(P_2BQ_2)V=-P_2CQ_1,
\]
或等价地,
\[(-P_2^{-1}UP_1)A-B(Q_2VQ_1^{-1})=C.
\]
令\(X=-P_2^{-1}UP_1\), \(Y=Q_2VQ_1^{-1}\), 即证.
例16 设\(A,B\)分别为\(m\times n\)与\(n\times m\)矩阵, 则\({\rm r}(A)+{\rm r}(B)={\rm r}(AB)+n\) 的充要条件为存在矩阵\(X,Y\)使得
\(XA-BY=E_n\).
证明 由Sylvester不等式的证明过程知只需证明
\[{\rm r}\left(\begin{array}{cc} A&O\\O&B\end{array}\right)
={\rm r}\left(\begin{array}{cc} A&O\\ E&B\end{array}\right)
\Longleftrightarrow
\exists X,Y, \mbox{s.t.} XA-BY=E_n.
\]
这由上题即得.
\(\S3\) 通过构造分块矩阵,再利用广义初等变换将其化为分块上(下)三角矩阵是解决行列式等式的常用方法.
例17 设\(A\,,\,B\,,\,C\,,\,D\)是\(n\)阶方阵, \(|A|\ne 0\). 证明
(1) 若\(AC=CA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|AD-CB|\,;\)
(2) 若 \(AB=BA\),\ 则
\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|DA-CB|\,.\)
证明 (1),若\(A\)可逆, 则
\begin{eqnarray}\begin{pmatrix}E&O\-A^{-1}C&E\end{pmatrix}\begin{pmatrix}A&B\C&D\end{pmatrix}&=&\begin{pmatrix}A&B\
-A{-1}CA+C&-ACB+D\end{pmatrix}$$12pt]
&\begin{tabular}{c}
\(\mbox{\scriptsize{AC=CA}}\)\
\hline\hline
\end{tabular}&\begin{pmatrix}A&B\O&-A^{-1}CB+D\end{pmatrix},,\end{eqnarray}
故$$\begin{vmatrix}A&B\C&D\end{vmatrix}=|A||-A^{-1}CB+D|=|AD-CB|,.$$
(2) 类似可证.
例18 [中国科学院大学2010]
设\(A, B\)分别是\(n\times m\)与\(m\times n\) 矩阵. 证明
\[|E_n-AB|=\begin{vmatrix}E_m&B\\ A&E_n\end{vmatrix}=|E_m-BA|.
\]
证明 一方面,
\[\begin{pmatrix}E&O\\-A&E\end{pmatrix}
\begin{pmatrix}E_m&B\\A&E_n\end{pmatrix}
=
\begin{pmatrix}E_m&B\\
O&E_n-AB\end{pmatrix}
\]
故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m||E_n-AB|=|E_n-AB|,.$$
另一方面,
\[\begin{pmatrix}E&-B\\O&E\end{pmatrix}
\begin{pmatrix}E_m&B\\A&E_n\end{pmatrix}
=
\begin{pmatrix}E_m-BA&O\\
O&E_n\end{pmatrix}
\]
故$$\begin{vmatrix}E_m&B\ A&E_n\end{vmatrix}
=|E_m-BA||E_n|=|E_m-BA|,.$$
所以
\[|E_n-AB|=\begin{vmatrix}E_m&B\\ A&E_n\end{vmatrix}=|E_m-BA|.
\]
注 [上海交通大学2005]
设\(A,B\)为\(n\)阶方阵,满足
\({\rm r}(E-AB)+{\rm r}(E+BA)=n\). 求证:\({\rm r}(A)=n\).
(提示: 先证\({\rm r}(E+BA)={\rm r}(E+AB)\), 从而\({\rm r}(E-AB)+{\rm r}(E+AB)=n\), 故\((AB)^2=E\), \(A\)可逆从而\({\rm r}(A)=n\), 参见\ref{Rank-AB-BA})
\end{remark}
下面的例子称为特征多项式的降阶公式.
例19 [上海大学2012]
设\(A, B\)分别是\(n\times m\)与\(m\times n\) 矩阵, \(\lambda\ne 0\). 证明
\[|\lambda E_n-AB|=\lambda^{n-m}|\lambda E_m-BA|.
\]
*证明 一方面,
\[\begin{pmatrix}E_n&O\\-\lambda^{-1} A&E\end{pmatrix}
\begin{pmatrix}\lambda E_m&B\\ A& E_n\end{pmatrix}
=
\begin{pmatrix}\lambda E_m&B\\
O&E_n-\lambda^{-1} AB\end{pmatrix}
\]
故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m||E_n-\lambda{-1}AB|=\lambda |\lambda E_n-AB|,.$$
另一方面,
\[\begin{pmatrix}E&-B\\O&E\end{pmatrix}
\begin{pmatrix}\lambda E_m&B\\A&E_n\end{pmatrix}
=
\begin{pmatrix}\lambda E_m-BA&O\\
O&E_n\end{pmatrix}
\]
故$$\begin{vmatrix}\lambda E_m&B\ A&E_n\end{vmatrix}
=|\lambda E_m-BA||E_n|=|\lambda E_m-BA|,.$$
所以
\[ |\lambda E_n-AB|=\lambda^{n-m}
|\lambda E_m-BA|.
\]