线性代数中许多命题对可逆矩阵而言证明十分容易, 然而对一般矩阵(非可逆)却可能相当棘手, 这时我们常常采用摄动法来解决. 所谓摄动法, 就是当一个命题对可逆矩阵容易证明其成立时, 对非可逆矩阵\(A\)加一个“摄动”------\(A+tE,\, t\in \mbox{F}\)------ 使得矩阵\(A+tE\) 可逆, 从而对无穷多个\(t\in \mbox{F}\), 命题关于\(A+tE\)成立; 然后利用下述引理, 证明对所有的\(t\in \mbox{F}\) 成立, 从而当\(t=0\)时也成立, 这样命题对一般的矩阵\(A\)也成立.

利用上面所讲的多项式插值方方法容易得到下面的结论:

引理1 若数域\(\mbox{F}\)上的\(n\)次多项式\(f(x)\)\(n+1\)个不同的根, 则\(f(x)=0\).

由上述引理立即可得

推论2\(f(x),g(x)\)是数域\(\mbox{F}\)上次数不超过\(n\) 的多项式, 如果存在\(n+1\)个不同的数\(a_0,a_1,\cdots,a_n\in \mbox{F}\) 使得
[f(a_i)=g(a_i),\quad i=0,1,\cdots,n.]
\(f(x)\equiv g(x)\), 即\(\forall a\in \mbox{F}, f(a)=g(a)\).

当然, 由于行列式\(|A+tE|\)是关于\(t\)的多项式函数, 从而在\(\mathbb{R}\) 上连续, 因而所讨论的命题若对可逆的\(A+tE\)成立时, 则也对\(t=0\) 成立.

例1 [浙江大学2004]
对数域\(\mbox{F}\)上的\(n\)阶矩阵\(A,B\), \((AB)^*=B^*A^*\).

证明\(A,B\)可逆, 则\(AB\)可逆, 从而[(AB)*=|AB|(AB)= (|B|B{-1})(|A|A)=B*A*.]
命题借助逆矩阵的性质较容易得到解决. 然而, 当\(A,B\)中只要有一个矩阵不可逆时, 这种方法就无法实施. 我们采用扰动法.

\(A\)可逆, \(B\)任意, 则存在无穷多个\(t\in \mF\), 使得\(tE+B\)可逆.
所以\(A(tE+B)^*=(tE+B)^*A^*\). 等式两边每个矩阵元素都是关于\(t\)的次数不超过\(n-1\) 的多项式, 但对无穷多个\(t\in \mbox{F}\) 成立, 因而是恒等式, 所以对任意的\(t\in \mbox{F}\) 成立.当\(t=0\) 时, \((AB)^*=B^*A^*\);

\(A,B\)都是任意矩阵时, 存在无穷多个\(t\in \mbox{F}\), 使得\(tE+A\)可逆. 则\(((tE+A)B)^*=B^*(tE+A)^*\). 类似于上面的讨论, 这是个恒等式, 对任意的\(t\in \mbox{F}\)成立.当\(t=0\) 时, \((AB)^*=B^*A^*\).

例2 求分块矩阵\(\left(\begin{array}{cc} A&B \\ O& C \end{array}\right)\)
的伴随矩阵.

证明 (1) 若\(|A|\ne 0, |C|\ne 0\), 则\(\left|\begin{array}{cc} A&B \\ O& C \end{array}\right|\ne 0\), 从而

\[\begin{array}{rl} &\left(\begin{array}{cc} A&B \\ O& C \end{array}\right)^*=\left|\begin{array}{cc} A&B \\ O& C \end{array}\right|\left(\begin{array}{cc} A&B \\ O& C \end{array}\right)^{-1}\\ =&|A||C|\left(\begin{array}{cc} A^{-1}&-A^{-1}BC^{-1} \\ O& C^{-1} \end{array}\right) =\left(\begin{array}{cc} |C|A^*&-A^*BC^* \\ O& |A|C^* \end{array}\right) \end{array} \]

(2) 若\(|A|=0\)\(|C|=0\), 则考虑用\(A+tE\)\(C+tE\)代替\(A\)\(C\), 则上式依然成立, 由摄动法原理知对\(t=0\)也成立. 所以

\[\left(\begin{array}{cc} A&B \\ O& C \end{array}\right)^*=\left(\begin{array}{cc} |C|A^*&-A^*BC^* \\ O& |A|C^* \end{array}\right).\]

例 3 [上海大学2013,兰州大学2009、2006,东北大学2002]
\(A\,,\,B\,,\,C\,,\,D\)\(n\)阶方阵. 证明若\(AC=CA\),\ 则

\[\begin{vmatrix}A&B\\C&D\end{vmatrix}=|AD-CB|. \]

证明\(A\)可逆, 则

\[ \begin{pmatrix} E&O\\-A^{-1}C&E\end{pmatrix} \begin{pmatrix}A&B\\C&D\end{pmatrix}=\begin{pmatrix}A&B\\ -A^{-1}CA+C&-A^{-1}CB+D\end{pmatrix} =\begin{pmatrix}A&B\\O&-A^{-1}CB+D\end{pmatrix} \]

\[\begin{vmatrix}A&B\\C&D\end{vmatrix}=|A||-A^{-1}CB+D|=|AD-CB|\,. \]

\(A\) 不可逆, 则存在无穷多个\(t\in \mbox{F}\)使得\(A+tE\)可逆,
所以

\[\begin{vmatrix}A+tE&B\\C&D\end{vmatrix}=|(A+tE)D-CB| \]

由于两边是关于\(t\) 的次数至多为\(n\)的多项式, 故恒等, 因而对任意\(t\in \mbox{F}\) 成立. 令\(t=0\),,

\[\begin{vmatrix}A&B\\C&D\end{vmatrix}=|AD-CB| \]

该例可变式为:若 \(AB=BA\), 则\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|DA-CB|\,.\)

例4\(A\)\(n\)阶实反对称矩阵, \(D=\diag(d_1,d_2,\cdots,d_n)\)是对角矩阵, \(d_j>0, j=1,2,\cdots,n\). 则\(|A+D|>0\).

证明 先证明\(|A+D|\ne 0\). 由Cramer法则, 只需证明\((A+D)x=0\) 只有零解. 设\(x=(x_1,x_2,\cdots, x_n)^T\)\((A+D)x=0\) 的任一解. 因为\(x^T(A+D)x=0\), 转置得\(x^T(-A+D)x=0\). 两式相加, 得\(x^TDx=0\), 即\(d_1x_1^2+d_2x_2^2+\cdots+ d_nx_n^2=0\), 故\(x=0\).

对任意的\(t\in\mathbb{R}\), \(tA\)仍是反对称矩阵, 所以\(|tA+D|\ne 0\). 由于当\(t=0\)时, \(|D|>0\). 由于\(|tA+D|\) 是关于\(t\)\(\mathbb{R}\)上的连续函数, 所以当\(t=1\)时, \(|A+D|>0\) (否则, 将\(\exists t_0\in\mathbb{R}\)使得\(|t_0A+D|=0\)).

例5\(A,B\in\mbox{F}^{n\times n}\), \(AB=BA\). 若\(A\)是幂零矩阵,则\(|A+B|=|B|\).

证明 (1) 假设\(B\)可逆,由\(AB=BA\), \(A\)幂零知\(AB^{-1}\)也是幂零矩阵. 设\(AB^{-1}\)的Jordan标准形为\(J\), \(J\)的主对角元全为零. 所以\(|E_n+AB^{-1}|=|E_n+J|=1\), 故

\[|A+B|=|E_n+AB^{-1}|\cdot |B|=|B|. \]

(2) 对一般的矩阵\(B\), 考虑\(B_t=tE_n+B\). 则存在无穷多个\(t\in\mbox{F}\), 使得\(B_t\)可逆,从而
\(|A+B_t|=|B_t|.\) 由于等式两边是关于\(t\)的次数不超过\(n\)的多项式,所以对任意的\(t\in\mbox{F}\)\(|A+B_t|=|B_t|\)成立. 特别地,当\(t=0\)时, 得到\(|A+B|=|B|.\)

摄动法的思想是通过添加适当的“摄动”由一般情形过渡到特殊情形, 如上面提到的由一般矩阵(不可逆)过渡到可逆矩阵, 后面我们还将看到由一般矩阵过渡到有\(n\) 个不同特征值的矩阵等等. 请同学们在学习中发现更多的摄动方法.

例6\(A,B\)\(n\)阶半正定矩阵,则\(|A+B|\geqslant |A|+|B|\).

证明 (1) 假设\(A\)是正定矩阵,则存在可逆矩阵\(P\)使得\(A=P^2\), 故

\[|A+B|=|A|\cdot |E_n+P^{-1}BP^{-1}|. \]

\(P^{-1}BP^{-1}\)的特征值为\(\lambda_1,\lambda_2,\cdots,\lambda_n\), 则

\[ |E_n+P^{-1}BP^{-1}|= \prod_{i=1}^n(1+\lambda_i)\geqslant 1+\lambda_1\lambda_2\cdots\lambda_n\ =|E_n|+|P^{-1}BP^{-1}|. \]

\[\begin{aligned} |A+B|&=|A|\cdot |E_n+P^{-1}BP^{-1}|\\ &\geqslant |A|\cdot (|E_n|+|P^{-1}BP^{-1}|)\\ &= |A|+|B|. \end{aligned} \]

(2) 若\(A\)为半正定矩阵,则考虑\(A_t=tE_m+A\), 当\(t>0\)时, \(A_t\)为正定矩阵. 由(1)知

\[|A_t+B|\geqslant |A_t|+|B|. \]

\(t\rightarrow 0\),得\(|A+B|\geqslant |A|+|B|\).

引理3\(A\)\(n\)阶复方阵, 存在矩阵\(B\), 使得\(A_t=A+tB\)的特征值互异.

证明 由Schur引理知,存在可逆矩阵\(P\)使得

\[P^{-1}AP=\begin{pmatrix} \lambda_1&a_{12}&\cdots&a_{1n}\\ &\lambda_2&\cdots&a_{2n}\\ &&\ddots&\vdots\\ &&&\lambda_n \end{pmatrix}. \]

\(D=\mbox{diag}(1,t,t^2,\cdots,t^{n-1})\), \(B=PDP^{-1}\), 则存在无穷多\(t\in\mathbb{C}\)使得\(A_t=A+tB\)的特征值互异.

Cayley-Hamilton定理\(A\)\(n\)解复方阵,\(f_A(\lambda)=|\lambda E-A|\)\(A\)的特征多项式,则\(f_A(A)=O\).

证明 (1) 若\(A=\mbox{diag}(a_1,a_2,\cdots,a_n)\)是对角矩阵,则\(f_A(\lambda)=(\lambda-a_1)(\lambda-a_2)\cdots(\lambda-a_n)\). 所以

\[f_A(A)=(A-a_1E)(A-a_2E)\cdots(A-a_nE)=O. \]

(2) 若\(A\)\(n\)个特征值互异,所以存在可逆矩阵\(P\)使得\(P^{-1}AP=\Lambda\), 从而\(A=P\Lambda P^{-1}\). 由于\(f_A(\lambda)=f_{\Lambda}(\lambda)\), 所以由(1)知

\[f_A(A)=f_A(P\Lambda P^{-1})=Pf_{\Lambda}(\Lambda)P^{-1}=O。 \]

(3) 对于一般的矩阵\(A\), 由\ref{Diffeiegn}知存在矩阵\(B\)及无穷多个\(t\in\mathbb{R}\), 使得\(A_t=A+tB\)的特征值互异. 由(2)知

\[f_{A_t}(A+tB)=O. \]

\(t\rightarrow 0\)时, 得到

\[f_A(A)=O. \]

例7\(A\in\mathbb{C}^{n\times n}\), 定义线性变换\(\mathscr{A}: \mathbb{C}^{n\times n}\rightarrow \mathbb{C}^{n\times n}\), \(B\mapsto AB-BA\). 证明:如果\(A\)的特征值是\(\lambda_1,\lambda_2,\cdots,\lambda_n\), 则\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).

证明 (1) 当\(A\)可对角化时, 即存在可逆矩阵\(P\)使得

\[P^{-1}AP=\mbox{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)=D. \]

由于基本矩阵\(E_{ij},i,j=1,2,\cdots,n\)\(\mathbb{C}^{n\times n}\)的一组基, 所以\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)也是\(\mathbb{C}^{n\times n}\) 的一组基. 由于

\[\mathscr{A}(PE_{ij}P^{-1})=A(PE_{ij}P^{-1}-(PE_{ij}P^{-1}))A =P(DE_{ij}-E_{ij}D)P^{-1}=(\lambda_i-\lambda_j)PE_{ij}P^{-1}, \]

所以\(\mathscr{A}\)\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)下的矩阵是对角矩阵

\[M=\mbox{dia}g(0,\lambda_1-\lambda_2,\cdots,\lambda_1-\lambda_n, \cdots,\lambda_n-\lambda_1,\cdots,\lambda_n-\lambda_{n-1},0). \]

从而\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).

(2) 考虑一般矩阵\(A\). 由Schur引理知存在可逆矩阵\(P\)使得\(P^{-1}AP\)为上三角矩阵, 令

\[A(t)=A+P\diag(t,t^2,\cdots,t^n)P^{-1}. \]

\(A(t)\)的特征值为\(\lambda_i+t^i\;(i=1,2,\cdots,n)\). 因为使\(A(t)\)有相同特征值的复数\(t\)金由有限个,所以存在无限多个\(t\in\mathbb{C}\)使得\(A(t)\)的特征值互异,从而\(A(t)\)可对角化. 由(1)知\(\A(t)\)在在\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)下的矩阵\(M(t)\)的特征多项式为

\[f_{M(t)}(\lambda)=\prod_{i=1}^n \prod_{j=1}^n\big(\lambda-(\lambda_i-\lambda_j+t^i-t^j)\big). \]

作为\(t\)的多项式,上式对无限多个\(t\in\mathbb{C}\)成立,因而对所有的\(t\in\mathbb{C}\)成立.
特别地,当\(t=0\)时,上式也成立,即

\[f_{\A}(\lambda)=f_{\A(0)}(\lambda)=\prod_{i=1}^n \prod_{j=1}^n\big(\lambda-(\lambda_i-\lambda_j)\big). \]

从而\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).