复旦大学2015--2016学年第二学期(15级)高等代数II期末考试第八大题解答
八、(本题10分) 设 $A,B$ 为 $n$ 阶正定实对称阵, 其算术平方根记为 $A^{\frac{1}{2}}$, $B^{\frac{1}{2}}$, 证明: 若 $A-B$ 为半正定阵, 则 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 也是半正定阵.
证法一 首先我们引用教材或白皮书上两道习题的结论.
引理1 (同时合同对角化, 教材复习题九的第31题、白皮书例9.66) 设 $A$ 是 $n$ 阶正定实对称阵, $B$ 是同阶实对称阵, 则存在非异实矩阵 $C$, 使得 $$C'AC=I_n,\,\,\,\,C'BC=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\},$$ 其中 $\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$ 是矩阵 $A^{-1}B$ 的全体特征值.
引理2 (教材复习题九的第24题、白皮书例9.49) 设 $D$ 是 $n$ 阶实矩阵, $DD'$ 的特征值为 $\mu_1\leq\mu_2\leq\cdots\leq\mu_n$, 则对 $D$ 的任一特征值 $\lambda$, 有 $\sqrt{\mu_1}\leq |\lambda|\leq \sqrt{\mu_n}$.
其次我们对 $A^{\frac{1}{2}}$ 和 $B^{\frac{1}{2}}$ 进行同时合同对角化并将问题进行化简. 因为 $A^{\frac{1}{2}}$ 仍为正定阵, 故由引理1可知, 存在非异实矩阵 $C$, 使得 $$C'A^{\frac{1}{2}}C=I_n,\,\,\,\,C'B^{\frac{1}{2}}C=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\},$$ 其中 $\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$ 是矩阵 $A^{-\frac{1}{2}}B^{\frac{1}{2}}$ 的全体特征值. 因为 $B^{\frac{1}{2}}$ 仍为正定阵, 故所有的 $\lambda_i>0$. 根据上式, 要证明 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 是半正定阵, 只要证明所有的 $\lambda_i\leq 1$ 即可.
仿照上面相同的做法, 再对 $A,B$ 进行同时合同对角化, 利用 $A-B$ 是半正定阵可知, $A^{-1}B$ 的全体特征值 $\mu_1,\mu_2,\cdots,\mu_n$ 都满足 $0<\mu_i\leq 1$. 注意到 $A^{\frac{1}{2}}$ 是非异阵, 故 $A^{-1}B$ 相似于 $$A^{\frac{1}{2}}(A^{-1}B)A^{-\frac{1}{2}}=A^{-\frac{1}{2}}BA^{-\frac{1}{2}}=(A^{-\frac{1}{2}}B^{\frac{1}{2}})(A^{-\frac{1}{2}}B^{\frac{1}{2}})'.$$ 令 $D=A^{-\frac{1}{2}}B^{\frac{1}{2}}$, 最后利用引理2即得所有的 $\lambda_i\leq 1$.
证法二 对 $A^{\frac{1}{2}}$ 和 $B^{\frac{1}{2}}$ 进行同时合同对角化并将问题进行化简. 因为 $A^{\frac{1}{2}}$ 仍为正定阵, 故由引理1可知, 存在非异实矩阵 $C$, 使得 $$C'A^{\frac{1}{2}}C=I_n,\,\,\,\,C'B^{\frac{1}{2}}C=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\},$$ 其中 $\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$ 是矩阵 $A^{-\frac{1}{2}}B^{\frac{1}{2}}$ 的全体特征值. 因为 $B^{\frac{1}{2}}$ 仍为正定阵, 故所有的 $\lambda_i>0$. 根据上式, 要证明 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 是半正定阵, 只要证明所有的 $\lambda_i\leq 1$ 即可. 令 $\Lambda=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$, $D=C^{-1}(C^{-1})'=(d_{ij})$, 则 $D$ 为正定实对称阵. 注意到 $$C'(A-B)C=(C'A^{\frac{1}{2}}C)(C^{-1}(C^{-1})')(C'A^{\frac{1}{2}}C)-(C'B^{\frac{1}{2}}C)(C^{-1}(C^{-1})')(C'B^{\frac{1}{2}}C)\\=D-\Lambda D\Lambda$$ 为半正定阵, 故其第 $(i,i)$ 元 $d_{ii}-\lambda_i^2d_{ii}\geq 0$. 由于 $d_{ii}>0$, 故 $\lambda_i^2\leq 1$, 从而 $\lambda_i\leq 1$.
证法三 注意到 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 是实对称阵, 任取其实特征值 $\lambda_0$ 以及对应的实特征向量 $\alpha\neq 0$, 即 $(A^{\frac{1}{2}}-B^{\frac{1}{2}})\alpha=\lambda_0\alpha$, 于是 $B^{\frac{1}{2}}\alpha=(A^{\frac{1}{2}}-\lambda_0I)\alpha$. 上式转置后可得 $\alpha'B^{\frac{1}{2}}=\alpha'(A^{\frac{1}{2}}-\lambda_0I)$, 再将上述两式相乘可得 $$\alpha'B\alpha=\alpha'(A^{\frac{1}{2}}-\lambda_0I)^2\alpha=\alpha'A\alpha-2\lambda_0\alpha'A^{\frac{1}{2}}\alpha+\lambda_0^2\alpha'\alpha.$$ 上式化简可得 $$2\lambda_0\alpha'A^{\frac{1}{2}}\alpha=\alpha'(A-B)\alpha+\lambda_0^2\alpha'\alpha,$$ 或 $$\lambda_0\alpha'(A^{\frac{1}{2}}+B^{\frac{1}{2}})\alpha=\alpha'(A-B)\alpha,$$ 因为 $A-B$ 半正定以及 $A^{\frac{1}{2}}$ 正定或 $A^{\frac{1}{2}}+B^{\frac{1}{2}}$ 正定, 故有 $\lambda_0\geq 0$, 最后由 $\lambda_0$ 的任意性可知 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 为半正定阵.
证法四 因为 $A^{\frac{1}{2}}-B^{\frac{1}{2}}$ 是实对称阵, 故存在正交阵 $P$, 使得 $$P'(A^{\frac{1}{2}}-B^{\frac{1}{2}})P=\mathrm{diag}\{\lambda_1,\cdots,\lambda_n\},$$ 我们只要证明所有的 $\lambda_i\geq 0$ 即可. 设 $P'A^{\frac{1}{2}}P=(a_{ij})$, $P'B^{\frac{1}{2}}P=(b_{ij})$, 则由假设可知 $$a_{ij}=b_{ij}\,(1\leq i\neq j\leq n),\,\,\,\,a_{ii}-b_{ii}=\lambda_i\,(1\leq i\leq n).$$ 注意到 $P'(A-B)P=(P'A^{\frac{1}{2}}P)^2-(P'B^{\frac{1}{2}}P)^2$ 仍为半正定阵, 故其第 $(i,i)$ 元大于等于零, 即 $$\sum\limits_{j=1}^na_{ij}^2-\sum\limits_{j=1}^nb_{ij}^2=a_{ii}^2-b_{ii}^2=\lambda_i(a_{ii}+b_{ii})\geq 0.$$ 因为 $A^{\frac{1}{2}},B^{\frac{1}{2}}$ 正定, 故 $A^{\frac{1}{2}}+B^{\frac{1}{2}}$ 正定, 从而 $P'(A^{\frac{1}{2}}+B^{\frac{1}{2}})P$ 也正定, 于是其第 $(i,i)$ 元 $a_{ii}+b_{ii}>0$, 因此 $\lambda_i\geq 0$, 结论得证.
证法五 (微分法) 利用摄动法可以把问题转化为证明一个更一般的结论: 若 $A-B=C$ 为正定阵, 则 $A^{\frac{1}{m}}-B^{\frac{1}{m}}$ 也是正定阵, 其中 $m\geq 2$ 为正整数. 设 $A(t)=B+tC$, $M(t)=A(t)^{\frac{1}{m}}$, 其中 $t\geq 0$, 则容易验证 $M(t)$ 关于 $t$ 可导, 并且 $(M(t)^m)'=A(t)'=C>0$ (为方便起见, 后面用 $C>0\,(C\geq 0)$ 表示实对称阵 $C$ 是正定阵 ($C$ 是半正定阵)), 由求导法则可得 $$\sum_{i=0}^{m-1}M(t)^{m-1-i}M(t)'M(t)^i>0.$$ 因此只要能证明 $M(t)'>0$, 就可得 $M(1)>M(0)$, 即 $A^{\frac{1}{m}}>B^{\frac{1}{m}}$. 这就转化为证明一个纯代数的问题: 设 $M,L$ 为 $n$ 阶实对称阵, $M>0$ 且 $$\sum_{i=0}^{m-1}M^{m-1-i}LM^i>0\,\,\,\,(m\geq 2),\cdots\cdots(*)$$ 则 $L>0$. 对 $m$ 进行归纳证明. 当 $m=2$ 时, 条件为 $ML+LM>0$, 则对 $L$ 的任一实特征值 $\lambda_0$ 和实特征向量 $\alpha$, 即 $L\alpha=\lambda_0\alpha$, 对上述条件左乘 $\alpha'$, 右乘 $\alpha$ 可得 $$0<\alpha'(ML+LM)\alpha=\alpha'M(L\alpha)+(L\alpha)'M\alpha=2\lambda_0\alpha'M\alpha,$$ 由 $M$ 正定可知 $\alpha'M\alpha>0$, 从而 $\lambda_0>0$, 于是 $L>0$, 结论成立. 下设 $<m$ 时结论成立, 现证明 $=m$ 的情形. 按 $m$ 的奇偶性分两种情况考虑, 若 $m=2k$, 则条件可以整理为 $$M^k(\sum_{i=0}^{k-1}M^{k-1-i}LM^i)+(\sum_{i=0}^{k-1}M^{k-1-i}LM^i)M^k>0,$$ 由 $m=2$ 的证明可知 $\sum\limits_{i=0}^{k-1}M^{k-1-i}LM^i>0$, 再由归纳假设可知 $L>0$; 若 $m=2k+1$, 用反证法来证明结论, 设 $L$ 的最小特征值 $\lambda_0\leq 0$, 令 $N=L-\lambda_0I_n$, 则 $N$ 是半正定阵且 $\det(N)=0$. 由条件 $(*)$ 以及 $\lambda_0\leq 0$ 可知 $$\sum_{i=0}^{m-1}M^{m-1-i}NM^i=\sum_{i=0}^{m-1}M^{m-1-i}LM^i-m\lambda_0M^{m-1}>0,$$ 又由 $N\geq 0$ 可知 $M^kNM^k\geq 0$, 把这一项加入上式可得 $$M^k(\sum_{i=0}^{k}M^{k-i}NM^i)+(\sum_{i=0}^{k}M^{k-i}NM^i)M^k>0,$$ 由 $m=2$ 的证明可知 $\sum\limits_{i=0}^{k}M^{k-i}NM^i>0$, 再由归纳假设可知 $N>0$, 这与 $\det(N)=0$ 矛盾, 从而结论得证.
证法六 (积分法) 容易验证 $$A^{\frac{1}{2}}=\frac{2}{\pi}\int_0^{+\infty}(I_n+t^2A^{-1})^{-1}\mathrm{\,d}t.$$ 由 $A-B$ 半正定可得 $(I_n+t^2B^{-1})-(I_n+t^2A^{-1})$ 半正定 (参考白皮书例9.69), 从而 $(I_n+t^2A^{-1})^{-1}-(I_n+t^2B^{-1})^{-1}$ 半正定, 再由积分形式可得 $$A^{\frac{1}{2}}-B^{\frac{1}{2}}=\frac{2}{\pi}\int_0^{+\infty}\bigg((I_n+t^2A^{-1})^{-1}-(I_n+t^2B^{-1})^{-1}\bigg)\mathrm{\,d}t\geq 0.$$ 我们还可以做进一步的推广: 对任意的 $0<a<1$, 由积分形式 $$A^a=\frac{\int_0^{+\infty}(I_n+t^{\frac{1}{a}}A^{-1})^{-1}\mathrm{\,d}t}{\int_0^{+\infty}(1+t^{\frac{1}{a}})^{-1}\mathrm{\,d}t}$$ 可将结论推广为 $A^a-B^a$ 为半正定阵. $\Box$
注 证法一由朱胜林教授提供, 证法四由舒翔同学提供, 证法五由楼红卫教授提供. 在本次期末考试中, 只有陈建兵同学一人做出此题, 采用的是证法一. 证法四从本质上看与证法三是一致的, 按照证法三或证法四完全相同的论证过程, 我们可以证明如下推广 (由舒翔同学建议):
推广 设 $n$ 阶实对称阵 $A,B$ 满足 $A+B$ 为正定阵且 $A^2-B^2$ 为半正定阵, 则 $A-B$ 也为半正定阵.