实对称阵可对角化的几种证明及其推广

实对称阵是一类常见的矩阵, 它与实二次型和实内积空间上的自伴随算子有着密切的联系. 任一实对称阵 $A$ 均正交相似于对角阵, 即存在正交阵 $P$, 使得 $$P'AP=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}.$$ 实对称阵的这条重要性质, 通常在内积空间的框架中加以证明 (参考复旦高代教材第 9.5 节). 事实上, 这一性质既可以在引入矩阵可对角化的定义和判定准则后直接加以证明, 也可以利用 Jordan 标准型理论加以证明. 下面我们将给出实对称阵可对角化的几种证明, 为此先来证明三个简单的引理.

引理 1  实对称阵的特征值都是实数.

证明  设 $A$ 为 $n$ 阶实对称阵, $\lambda_0\in\mathbb{C}$ 是 $A$ 的任一特征值, $\alpha=(a_1,a_2,\cdots,a_n)'\in\mathbb{C}^n$ 是对应的特征向量, 即 $A\alpha=\lambda_0\alpha$. 上式两边同时左乘 $\overline{\alpha}'$, 则有 $\overline{\alpha}'A\alpha=\lambda_0\overline{\alpha}'\alpha$. 注意到 $\alpha$ 是非零向量, 故 $\overline{\alpha}'\alpha=\sum\limits_{i=1}^n|a_i|^2>0$. 注意到 $A$ 为实对称阵, 故 $\overline{(\overline{\alpha}'A\alpha)}'=\overline{\alpha}'A\alpha$, 即 $\overline{\alpha}'A\alpha$ 是一个实数, 从而 $\lambda_0=\dfrac{\overline{\alpha}'A\alpha}{\overline{\alpha}'\alpha}$ 也是实数.  $\Box$

引理 2  设 $A$ 为 $n$ 阶实对称阵, 则 $r(A)=r(A^2)=r(A^3)=\cdots$.

证明  由高代白皮书的例 3.72 可知 $r(A)=r(A'A)=r(A^2)$, 从而 $r(A)=r(A^{2^m})$ $(m\geq 1)$. 再由矩阵相乘秩相等或变小的性质以及夹逼法可知 $r(A)=r(A^k)\,(k\geq 1)$.  $\Box$

引理 3  设 $A$ 为 $n$ 阶实对称阵, 则 $\mathrm{Ker}A\cap\mathrm{Im}A=0$ 并且 $\mathrm{Ker}A=\mathrm{Ker}A^2=\mathrm{Ker}A^3=\cdots$.

证明  由引理 2 以及线性映射的维数公式即得.  $\Box$

定理 1  实对称阵可实对角化.

证法 1 (有完全的特征向量系)  由引理 1 可设 $A$ 的全体实特征值为 $\lambda_1,\lambda_2,\cdots,\lambda_n$, 我们对特征值 $\lambda_1$ 来证明其代数重数等于其几何重数. 不失一般性, 可设 $\lambda_1=\cdots=\lambda_m$, 但 $\lambda_j\neq \lambda_1\,(m<j\leq n)$, 即 $\lambda_1$ 的代数重数为 $m$. 由复旦高代教材的定理 6.1.2 及其后的注可知, 存在非异实矩阵 $P$, 使得 $P^{-1}AP=\begin{pmatrix} B & C \\ 0 & D \end{pmatrix}$, 其中 $B$ 是主对角元为 $\lambda_1$ 的 $m$ 阶上三角阵, $D$ 是主对角元分别为 $\lambda_{m+1},\cdots,\lambda_n$ 的上三角阵, 于是 $$P^{-1}(A-\lambda_1I_n)P=\begin{pmatrix} B-\lambda_1I_m & C \\ 0 & D-\lambda_1I_{n-m} \end{pmatrix}.$$ 注意到 $B-\lambda_1I_m$ 是主对角元全为零的上三角阵, 这是一个幂零阵, 故 $(B-\lambda_1I_m)^m=0$, 从而 $$P^{-1}(A-\lambda_1I_n)^mP=\begin{pmatrix} B-\lambda_1I_m & C \\ 0 & D-\lambda_1I_{n-m} \end{pmatrix}^m=\begin{pmatrix} 0 & * \\ 0 & (D-\lambda_1I_{n-m})^m \end{pmatrix}.$$ 注意到 $(D-\lambda_1I_{n-m})^m$ 是一个主对角元全不为零的上三角阵, 从而是非异阵, 于是 $r((A-\lambda_1I_n)^m)=n-m$. 注意到 $A-\lambda_1I_n$ 为实对称阵, 再由引理 2 可知, $\lambda_1$ 的几何重数为 $$n-r(A-\lambda_1I_n)=n-r((A-\lambda_1I_n)^m)=n-(n-m)=m,$$ 即几何重数等于代数重数.

证法 2 (全空间等于特征子空间的直和)  任取 $A$ 的实特征值 $\lambda_0$, 由引理 3 可知 $$\mathrm{Ker}(A-\lambda_0I_n)=\mathrm{Ker}(A-\lambda_0I_n)^2=\cdots,$$ 再由高代白皮书的例 7.13 的证法 1 完全相同的讨论即得结论. 另外, 由 $\mathrm{Ker}(A-\lambda_0I_n)=\mathrm{Ker}(A-\lambda_0I_n)^n$ 可知, $\lambda_0$ 的几何重数 $\dim\mathrm{Ker}(A-\lambda_0I_n)$ 等于其代数重数 $\dim\mathrm{Ker}(A-\lambda_0I_n)^n$, 即 $A$ 有完全的特征向量系, 这一方法比证法 1 更加简洁.

证法 3 (极小多项式无重根)  任取 $A$ 的实特征值 $\lambda_0$, 由引理 3 可知 $$\mathrm{Ker}(A-\lambda_0I_n)=\mathrm{Ker}(A-\lambda_0I_n)^2=\cdots,$$ 再由高代白皮书的例 7.13 的证法 2 完全相同的讨论即得结论.

证法 4 (Jordan 标准型之一)  任取 $A$ 的实特征值 $\lambda_0$, 由引理 3 可知 $$\mathrm{Ker}(A-\lambda_0I_n)\cap\mathrm{Im}(A-\lambda_0I_n)=0,$$ 再由高代白皮书的例 7.13 的证法 3 完全相同的讨论即得结论.

证法 5 (Jordan 标准型之二)  任取 $A$ 的实特征值 $\lambda_0$, 由引理 2 可知 $r(A-\lambda_0I_n)=r((A-\lambda_0)^2)$, 再由高代白皮书的例 7.14 的证法 2 完全相同的讨论即得结论.

证法 6 (Jordan 标准型之三)  设 $P$ 为非异实矩阵, 使得 $$P^{-1}AP=J=\mathrm{diag}\{J_{r_1}(\lambda_1),\cdots,J_{r_k}(\lambda_k)\}.$$ 用反证法, 若 $A$ 不可对角化, 则不妨设 $r_1>1$. 设 $P'P=(b_{ij})$, 则 $b_{12}=b_{21}$ 并且 $b_{11}$ 是 $P$ 的第一列元素的平方和, 由 $P$ 的非异性可知 $b_{11}>0$. 注意到 $P'AP=P'PJ$ 为对称阵, 但 $P'PJ$ 的第 $(1,2)$ 元为 $b_{11}+\lambda_1b_{12}$, 第 $(2,1)$ 元为 $\lambda_1b_{21}$, 这两者不相等, 矛盾.

证法 7 (内积空间理论)  参考复旦高代教材的定理 9.5.2 和推论 9.5.2.  $\Box$

事实上, 我们也可以这样来看. 由上面的讨论可知, 对任一 $n$ 阶实对称阵 $A$, 全空间 $\mathbb{R}^n$ 等于 $A$ 的所有特征子空间的直和. 容易证明: 在 $\mathbb{R}^n$ 的标准内积下, $A$ 的属于不同特征值的特征向量必正交, 属于同一特征值的特征向量可以利用 Gram-Schmidt 正交化方法化成两两正交的单位特征向量. 因此我们可以找到 $A$ 的 $n$ 个两两正交的单位特征向量, 将这些向量拼成矩阵 $P$, 则 $P$ 是一个 $n$ 阶正交阵, 使得 $$P'AP=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}.$$ 这就是 $A$ 的正交相似标准型, 它对于深入探讨实对称阵的正定性和半正定性有着重要的作用.

注 1  本题是 15 级高代 II 每周一题第 10 题第 1 小问以及 16 级高代 II 每周一题第 6 题. 给出上述证法的复旦数学学院学生为: 章俊鑫 (证法 1), 何陶然 (类似证法 1), 徐钰伦 (证法 2), 杨锦文 (证法 2), 杨钊杰 (证法 2), 蒋亦凡 (证法 3), 胡晓波 (证法 5), 杨彦婷 (证法 5), 沈伊南 (类似证法 6).

下面将实对称阵可对角化的几种证法进行适当地推广, 从而不利用酉相似标准型理论也可以直接证明: 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, 酉阵, 以及更一般的复正规阵均可复对角化. 这是 15 级高代 II 每周一题第 10 题第 2 小问以及 17 级高代 II 每周一题第 7 题第 2 小问. 我们先给出前三个引理的推广.

引理 4  Hermite 阵的特征值都是实数. 特别地, 斜 Hermite 阵 (实反对称阵) 的特征值都是 0 或纯虚数.

证明  Hermite 阵情形的证明完全类似于实对称阵情形的证明 (参考引理 1). 设 $A$ 为斜 Hermite 阵, 则 $\mathrm{i}A$ 为 Hermite 阵, 从而 $\mathrm{i}A$ 的特征值都是实数, 于是 $A$ 的特征值都是 0 或纯虚数. 实反对称阵是一种特殊的斜 Hermite 阵, 故结论也成立.  $\Box$

引理 5  设 $A$ 为 $n$ 阶复正规阵, 则 $r(A)=r(A^2)=r(A^3)=\cdots$.

证明  由高代白皮书的例 3.72 对应的复版本可知: 对任意的 $m\times n$ 阶复矩阵 $A$, 有 $$r(A)=r(\overline{A}'A)=r(A\overline{A}').$$ 特别地, 若 $A$ 是 Hermite 阵, 则 $r(A)=r(A^2)$, 再仿照引理 2 的证明即得结论. 若 $A$ 是复正规阵, 即 $A\overline{A}'=\overline{A}'A$, 注意到 $A\overline{A}'$ 是 Hermite 阵, 故有 $$r(A^2)=r(A^2\overline{A^2}')=r(AA\overline{A}'\overline{A}')=r(A\overline{A}'A\overline{A}')=r((A\overline{A}')^2)=r(A\overline{A}')=r(A),$$ 再仿照引理 2 的证明即得结论.  $\Box$

引理 6  设 $A$ 为 $n$ 阶复正规阵, 则 $\mathrm{Ker}A\cap\mathrm{Im}A=0$ 并且 $\mathrm{Ker}A=\mathrm{Ker}A^2=\mathrm{Ker}A^3=\cdots$.

证明  由引理 5 以及线性映射的维数公式即得.  $\Box$

定理 2  复正规阵可对角化. 特别地, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, 酉阵均可复对角化.

证明  定理 1 的证法 1--证法 5 可完全平行地改写用于证明定理 2; 定理 1 的证法 6 适当地修改之后可以证明: 实反对称阵, Hermite 阵, 斜 Hermite 阵均可复对角化; 我们把具体的证明过程留给感兴趣的读者自行完成. 证法 7 可参考复旦高代教材的定理 9.6.2 和定理 9.6.3.  $\Box$

注 2  本文中的相关思想可推广为一般的可对角化判定准则, 具体的内容请参考教学博文 [3].

 

参考文献

[1]  高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.

[2]  高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.

[3]  谢启鸿, 可对角化的其他判定准则及其应用, https://www.cnblogs.com/torsor/p/13569961.html

posted @ 2017-04-29 19:38  torsor  阅读(32249)  评论(0编辑  收藏  举报