线性代数中许多命题对可逆矩阵而言证明十分容易, 然而对一般矩阵(非可逆)却可能相当棘手, 这时我们常常采用摄动法来解决. 所谓摄动法, 就是当一个命题对可逆矩阵容易证明其成立时, 对非可逆矩阵\(A\)加一个“摄动”------\(A+tE,\, t\in \mbox{F}\)------ 使得矩阵\(A+tE\) 可逆, 从而对无穷多个\(t\in \mbox{F}\), 命题关于\(A+tE\)成立; 然后利用下述引理, 证明对所有的\(t\in \mbox{F}\) 成立, 从而当\(t=0\)时也成立, 这样命题对一般的矩阵\(A\)也成立.
利用上面所讲的多项式插值方方法容易得到下面的结论:
引理1 若数域\(\mbox{F}\)上的\(n\)次多项式\(f(x)\)有\(n+1\)个不同的根, 则\(f(x)=0\).
由上述引理立即可得
推论2 设\(f(x),g(x)\)是数域\(\mbox{F}\)上次数不超过\(n\) 的多项式, 如果存在\(n+1\)个不同的数\(a_0,a_1,\cdots,a_n\in \mbox{F}\) 使得
[f(a_i)=g(a_i),\quad i=0,1,\cdots,n.]
则\(f(x)\equiv g(x)\), 即\(\forall a\in \mbox{F}, f(a)=g(a)\).
注 当然, 由于行列式\(|A+tE|\)是关于\(t\)的多项式函数, 从而在\(\mathbb{R}\) 上连续, 因而所讨论的命题若对可逆的\(A+tE\)成立时, 则也对\(t=0\) 成立.
例1 [浙江大学2004]
对数域\(\mbox{F}\)上的\(n\)阶矩阵\(A,B\), \((AB)^*=B^*A^*\).
证明 若\(A,B\)可逆, 则\(AB\)可逆, 从而[(AB)*=|AB|(AB)= (|B|B{-1})(|A|A)=B*A*.]
命题借助逆矩阵的性质较容易得到解决. 然而, 当\(A,B\)中只要有一个矩阵不可逆时, 这种方法就无法实施. 我们采用扰动法.
若\(A\)可逆, \(B\)任意, 则存在无穷多个\(t\in \mF\), 使得\(tE+B\)可逆.
所以\(A(tE+B)^*=(tE+B)^*A^*\). 等式两边每个矩阵元素都是关于\(t\)的次数不超过\(n-1\) 的多项式, 但对无穷多个\(t\in \mbox{F}\) 成立, 因而是恒等式, 所以对任意的\(t\in \mbox{F}\) 成立.当\(t=0\) 时, \((AB)^*=B^*A^*\);
若\(A,B\)都是任意矩阵时, 存在无穷多个\(t\in \mbox{F}\), 使得\(tE+A\)可逆. 则\(((tE+A)B)^*=B^*(tE+A)^*\). 类似于上面的讨论, 这是个恒等式, 对任意的\(t\in \mbox{F}\)成立.当\(t=0\) 时, \((AB)^*=B^*A^*\).
例2 求分块矩阵\(\left(\begin{array}{cc}
A&B \\ O& C
\end{array}\right)\)
的伴随矩阵.
证明 (1) 若\(|A|\ne 0, |C|\ne 0\), 则\(\left|\begin{array}{cc} A&B \\ O& C \end{array}\right|\ne 0\), 从而
(2) 若\(|A|=0\)或\(|C|=0\), 则考虑用\(A+tE\)或\(C+tE\)代替\(A\)或\(C\), 则上式依然成立, 由摄动法原理知对\(t=0\)也成立. 所以
例 3 [上海大学2013,兰州大学2009、2006,东北大学2002]
设\(A\,,\,B\,,\,C\,,\,D\)是\(n\)阶方阵. 证明若\(AC=CA\),\ 则
证明 若\(A\)可逆, 则
故
若 \(A\) 不可逆, 则存在无穷多个\(t\in \mbox{F}\)使得\(A+tE\)可逆,
所以
由于两边是关于\(t\) 的次数至多为\(n\)的多项式, 故恒等, 因而对任意\(t\in \mbox{F}\) 成立. 令\(t=0\),,
注 该例可变式为:若 \(AB=BA\), 则\(\begin{vmatrix}A&B\\C&D\end{vmatrix}=|DA-CB|\,.\)
例4 设\(A\)是\(n\)阶实反对称矩阵, \(D=\diag(d_1,d_2,\cdots,d_n)\)是对角矩阵, \(d_j>0, j=1,2,\cdots,n\). 则\(|A+D|>0\).
证明 先证明\(|A+D|\ne 0\). 由Cramer法则, 只需证明\((A+D)x=0\) 只有零解. 设\(x=(x_1,x_2,\cdots, x_n)^T\)是\((A+D)x=0\) 的任一解. 因为\(x^T(A+D)x=0\), 转置得\(x^T(-A+D)x=0\). 两式相加, 得\(x^TDx=0\), 即\(d_1x_1^2+d_2x_2^2+\cdots+ d_nx_n^2=0\), 故\(x=0\).
对任意的\(t\in\mathbb{R}\), \(tA\)仍是反对称矩阵, 所以\(|tA+D|\ne 0\). 由于当\(t=0\)时, \(|D|>0\). 由于\(|tA+D|\) 是关于\(t\)在\(\mathbb{R}\)上的连续函数, 所以当\(t=1\)时, \(|A+D|>0\) (否则, 将\(\exists t_0\in\mathbb{R}\)使得\(|t_0A+D|=0\)).
例5 设\(A,B\in\mbox{F}^{n\times n}\), \(AB=BA\). 若\(A\)是幂零矩阵,则\(|A+B|=|B|\).
证明 (1) 假设\(B\)可逆,由\(AB=BA\), \(A\)幂零知\(AB^{-1}\)也是幂零矩阵. 设\(AB^{-1}\)的Jordan标准形为\(J\), \(J\)的主对角元全为零. 所以\(|E_n+AB^{-1}|=|E_n+J|=1\), 故
(2) 对一般的矩阵\(B\), 考虑\(B_t=tE_n+B\). 则存在无穷多个\(t\in\mbox{F}\), 使得\(B_t\)可逆,从而
\(|A+B_t|=|B_t|.\) 由于等式两边是关于\(t\)的次数不超过\(n\)的多项式,所以对任意的\(t\in\mbox{F}\),\(|A+B_t|=|B_t|\)成立. 特别地,当\(t=0\)时, 得到\(|A+B|=|B|.\)
摄动法的思想是通过添加适当的“摄动”由一般情形过渡到特殊情形, 如上面提到的由一般矩阵(不可逆)过渡到可逆矩阵, 后面我们还将看到由一般矩阵过渡到有\(n\) 个不同特征值的矩阵等等. 请同学们在学习中发现更多的摄动方法.
例6 设\(A,B\)是\(n\)阶半正定矩阵,则\(|A+B|\geqslant |A|+|B|\).
证明 (1) 假设\(A\)是正定矩阵,则存在可逆矩阵\(P\)使得\(A=P^2\), 故
设\(P^{-1}BP^{-1}\)的特征值为\(\lambda_1,\lambda_2,\cdots,\lambda_n\), 则
故
(2) 若\(A\)为半正定矩阵,则考虑\(A_t=tE_m+A\), 当\(t>0\)时, \(A_t\)为正定矩阵. 由(1)知
取\(t\rightarrow 0\),得\(|A+B|\geqslant |A|+|B|\).
引理3 设\(A\)是\(n\)阶复方阵, 存在矩阵\(B\), 使得\(A_t=A+tB\)的特征值互异.
证明 由Schur引理知,存在可逆矩阵\(P\)使得
令\(D=\mbox{diag}(1,t,t^2,\cdots,t^{n-1})\), \(B=PDP^{-1}\), 则存在无穷多\(t\in\mathbb{C}\)使得\(A_t=A+tB\)的特征值互异.
Cayley-Hamilton定理 设\(A\)是\(n\)解复方阵,\(f_A(\lambda)=|\lambda E-A|\)是\(A\)的特征多项式,则\(f_A(A)=O\).
证明 (1) 若\(A=\mbox{diag}(a_1,a_2,\cdots,a_n)\)是对角矩阵,则\(f_A(\lambda)=(\lambda-a_1)(\lambda-a_2)\cdots(\lambda-a_n)\). 所以
(2) 若\(A\)的\(n\)个特征值互异,所以存在可逆矩阵\(P\)使得\(P^{-1}AP=\Lambda\), 从而\(A=P\Lambda P^{-1}\). 由于\(f_A(\lambda)=f_{\Lambda}(\lambda)\), 所以由(1)知
(3) 对于一般的矩阵\(A\), 由\ref{Diffeiegn}知存在矩阵\(B\)及无穷多个\(t\in\mathbb{R}\), 使得\(A_t=A+tB\)的特征值互异. 由(2)知
当\(t\rightarrow 0\)时, 得到
例7 设\(A\in\mathbb{C}^{n\times n}\), 定义线性变换\(\mathscr{A}: \mathbb{C}^{n\times n}\rightarrow \mathbb{C}^{n\times n}\), \(B\mapsto AB-BA\). 证明:如果\(A\)的特征值是\(\lambda_1,\lambda_2,\cdots,\lambda_n\), 则\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).
证明 (1) 当\(A\)可对角化时, 即存在可逆矩阵\(P\)使得
由于基本矩阵\(E_{ij},i,j=1,2,\cdots,n\)是\(\mathbb{C}^{n\times n}\)的一组基, 所以\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)也是\(\mathbb{C}^{n\times n}\) 的一组基. 由于
所以\(\mathscr{A}\)在\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)下的矩阵是对角矩阵
从而\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).
(2) 考虑一般矩阵\(A\). 由Schur引理知存在可逆矩阵\(P\)使得\(P^{-1}AP\)为上三角矩阵, 令
则\(A(t)\)的特征值为\(\lambda_i+t^i\;(i=1,2,\cdots,n)\). 因为使\(A(t)\)有相同特征值的复数\(t\)金由有限个,所以存在无限多个\(t\in\mathbb{C}\)使得\(A(t)\)的特征值互异,从而\(A(t)\)可对角化. 由(1)知\(\A(t)\)在在\(PE_{ij}P^{-1},i,j=1,2,\cdots,n\)下的矩阵\(M(t)\)的特征多项式为
作为\(t\)的多项式,上式对无限多个\(t\in\mathbb{C}\)成立,因而对所有的\(t\in\mathbb{C}\)成立.
特别地,当\(t=0\)时,上式也成立,即
从而\(\mathscr{A}\)的特征值是\(\lambda_i-\lambda_j,\; i,j=1,2,\cdots,n\).