可对角化的其他判定准则及其应用
矩阵或线性变换的可对角化判定是高等代数的重要知识点. 由于判定准则多, 技巧性强, 故可对角化判定一直是教学和考试中的难点. 一般来说, 判定 $n$ 维复线性空间 $V$ 上的线性变换 $\varphi$ (或 $n$ 阶复矩阵 $A$) 可对角化, 通常有以下六种方法 (参考复旦高代教材的第六章和第七章):
(D1) $\varphi$ 可对角化的充要条件是 $\varphi$ 有 $n$ 个线性无关的特征向量;
(D2) 若 $\varphi$ 有 $n$ 个不同的特征值, 则 $\varphi$ 可对角化;
(D3) $\varphi$ 可对角化的充要条件是 $V$ 是 $\varphi$ 的特征子空间的直和;
(D4) $\varphi$ 可对角化的充要条件是 $\varphi$ 有完全的特征向量系, 即对 $\varphi$ 的任一特征值, 其几何重数等于其代数重数;
(D5) $\varphi$ 可对角化的充要条件是 $\varphi$ 的极小多项式无重根;
(D6) $\varphi$ 可对角化的充要条件是 $\varphi$ 的 Jordan 块都是一阶的, 或等价地, $\varphi$ 的初等因子都是一次多项式.
本文的主要目的是, 给出可对角化的一些其他的判定准则及其应用. 以下总是以线性变换作为对象来阐述和证明结论, 其对应的矩阵版本, 留给读者自己补充完整.
首先, 我们来证明一个具有良好性质的线性变换的大型引理.
引理 1 设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, 则以下九个结论等价:
(1) $V=\mathrm{Ker}\varphi\oplus\mathrm{Im}\varphi$;
(2) $V=\mathrm{Ker}\varphi+\mathrm{Im}\varphi$;
(3) $\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0$;
(4) $\mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2$, 或等价地, $\dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2$;
(5) $\mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi^3=\cdots$, 或等价地, $\dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2=\dim\mathrm{Ker}\varphi^3=\cdots$;
(6) $\mathrm{Im}\varphi=\mathrm{Im}\varphi^2$, 或等价地, $r(\varphi)=r(\varphi^2)$;
(7) $\mathrm{Im}\varphi=\mathrm{Im}\varphi^2=\mathrm{Im}\varphi^3=\cdots$, 或等价地, $r(\varphi)=r(\varphi^2)=r(\varphi^3)=\cdots$;
(8) $\mathrm{Ker}\varphi$ 存在 $\varphi$-不变补空间, 即存在 $\varphi$-不变子空间 $U$, 使得 $V=\mathrm{Ker}\varphi\oplus U$;
(9) $\mathrm{Im}\varphi$ 存在 $\varphi$-不变补空间, 即存在 $\varphi$-不变子空间 $W$, 使得 $V=\mathrm{Im}\varphi\oplus W$.
证明 由直和的定义可知 (1) $\Leftrightarrow$ (2)+(3), 于是 (1) $\Rightarrow$ (2) 和 (1) $\Rightarrow$ (3) 都是显然的. 根据交和空间维数公式和线性映射维数公式可知 $$\dim(\mathrm{Ker}\varphi+\mathrm{Im}\varphi)=\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi)$$ $$=\dim V-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi),$$ 于是 (2) $\Leftrightarrow$ (3) 成立, 从而前三个结论两两等价.
(3) $\Rightarrow$ (4): 显然 $\mathrm{Ker}\varphi\subseteq\mathrm{Ker}\varphi^2$ 成立. 任取 $\alpha\in\mathrm{Ker}\varphi^2$, 则 $\varphi(\alpha)\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0$, 于是 $\varphi(\alpha)=0$, 即 $\alpha\in\mathrm{Ker}\varphi$, 从而 $\mathrm{Ker}\varphi^2\subseteq\mathrm{Ker}\varphi$ 也成立, 于是 (4) 成立.
(4) $\Rightarrow$ (3): 任取 $\alpha\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi$, 则存在 $\beta\in V$, 使得 $\alpha=\varphi(\beta)$, 于是 $0=\varphi(\alpha)=\varphi^2(\beta)$, 即 $\beta\in\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi$, 从而 $\alpha=\varphi(\beta)=0$, 即 (3) 成立.
(5) $\Rightarrow$ (4) 是显然的, 下证 (4) $\Rightarrow$ (5): 设 $\mathrm{Ker}\varphi^k=\mathrm{Ker}\varphi^{k+1}$ 已对正整数 $k$ 成立, 先证 $\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^{k+2}$ 也成立, 然后用归纳法即得结论. $\mathrm{Ker}\varphi^{k+1}\subseteq\mathrm{Ker}\varphi^{k+2}$ 是显然的. 任取 $\alpha\in\mathrm{Ker}\varphi^{k+2}$, 即 $0=\varphi^{k+2}(\alpha)=\varphi^{k+1}(\varphi(\alpha))$, 于是 $\varphi(\alpha)\in\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^k$, 从而 $\varphi^{k+1}(\alpha)=\varphi^k(\varphi(\alpha))=0$, 即 $\alpha\in\mathrm{Ker}\varphi^{k+1}$, 于是 $\mathrm{Ker}\varphi^{k+2}\subseteq\mathrm{Ker}\varphi^{k+1}$ 也成立.
(3) $\Leftrightarrow$ (6): 考虑 $\varphi$ 在不变子空间 $\mathrm{Im}\varphi$ 上的限制变换 $\varphi|_{\mathrm{Im}\varphi}:\mathrm{Im}\varphi\to\mathrm{Im}\varphi$, 由限制的定义可知它的核等于 $\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi$, 它的像等于 $\mathrm{Im}\varphi^2$. 由于有限维线性空间上的线性变换是单射当且仅当它是满射, 当且仅当它是同构, 故 (3) $\Leftrightarrow$ (6) 成立.
(7) $\Rightarrow$ (6) 是显然的, 下证 (6) $\Rightarrow$ (7): 设 $\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}$ 已对正整数 $k$ 成立, 先证 $\mathrm{Im}\varphi^{k+1}=\mathrm{Im}\varphi^{k+2}$ 也成立, 然后用归纳法即得结论. $\mathrm{Im}\varphi^{k+2}\subseteq\mathrm{Im}\varphi^{k+1}$ 是显然的. 任取 $\alpha\in\mathrm{Im}\varphi^{k+1}$, 即存在 $\beta\in V$, 使得 $\alpha=\varphi^{k+1}(\beta)$. 由于 $\varphi^k(\beta)\in\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}$, 故存在 $\gamma\in V$, 使得 $\varphi^k(\beta)=\varphi^{k+1}(\gamma)$, 于是 $\alpha=\varphi^{k+1}(\beta)=\varphi(\varphi^k(\beta))=\varphi(\varphi^{k+1}(\gamma))=\varphi^{k+2}(\gamma)\in\mathrm{Im}\varphi^{k+2}$, 从而 $\mathrm{Im}\varphi^{k+1}\subseteq\mathrm{Im}\varphi^{k+2}$ 也成立.
(1) $\Rightarrow$ (8) 是显然的, 下证 (8) $\Rightarrow$ (1). 我们先证 $\mathrm{Im}\varphi\subseteq U$: 任取 $\varphi(v)\in\mathrm{Im}\varphi$, 由直和分解可设 $v=v_1+u$, 其中 $v_1\in\mathrm{Ker}\varphi$, $u\in U$, 则由 $U$ 的 $\varphi$-不变性可得 $\varphi(v)=\varphi(v_1)+\varphi(u)=\varphi(u)\in U$. 考虑不等式 $$\dim V=\dim(\mathrm{Ker}\varphi\oplus U)=\dim\mathrm{Ker}\varphi+\dim U$$ $$\geq\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi=\dim V,$$ 从而只能是 $U=\mathrm{Im}\varphi$, 于是 (1) 成立.
(1) $\Rightarrow$ (9) 是显然的, 下证 (9) $\Rightarrow$ (1). 我们先证 $W\subseteq\mathrm{Ker}\varphi$: 任取 $w\in W$, 则由 $W$ 的 $\varphi$-不变性可得 $\varphi(w)\in\mathrm{Im}\varphi\cap W=0$, 即有 $w\in\mathrm{Ker}\varphi$. 考虑不等式 $$\dim V=\dim(\mathrm{Im}\varphi\oplus W)=\dim\mathrm{Im}\varphi+\dim W$$ $$\leq\dim\mathrm{Im}\varphi+\dim\mathrm{Ker}\varphi=\dim V,$$ 从而只能是 $W=\mathrm{Ker}\varphi$, 于是 (1) 成立. $\Box$
注 1 引理 1 是 15 级高等代数 I 每周一题第 10 题, 其证明思路在高代白皮书的例 4.32, 例 4.33, 例 4.34 和例 7.13 中均有所涉及.
有了引理 1 做铺垫, 我们可以证明一系列的可对角化判定准则.
定理 1 设 $\varphi$ 是 $n$ 维复线性空间 $V$ 上的线性变换, 则 $\varphi$ 可对角化的充要条件是对 $\varphi$ 的任一特征值 $\lambda_0$, 下列条件之一成立:
(E1) $V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus\mathrm{Im}(\varphi-\lambda_0I_V)$;
(E2) $V=\mathrm{Ker}(\varphi-\lambda_0I_V)+\mathrm{Im}(\varphi-\lambda_0I_V)$;
(E3) $\mathrm{Ker}(\varphi-\lambda_0I_V)\cap\mathrm{Im}(\varphi-\lambda_0I_V)=0$;
(E4) $\mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2$, 或等价地, $\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2$;
(E5) $\mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots$, 或等价地, $\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots$;
(E6) $\mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2$, 或等价地, $r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2)$;
(E7) $\mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2=\mathrm{Im}(\varphi-\lambda_0I_V)^3=\cdots$, 或等价地, $r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2)=r((\varphi-\lambda_0I_V)^3)=\cdots$;
(E8) $\mathrm{Ker}(\varphi-\lambda_0I_V)$ 存在 $\varphi$-不变补空间, 即存在 $\varphi$-不变子空间 $U$, 使得 $V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus U$;
(E9) $\mathrm{Im}(\varphi-\lambda_0I_V)$ 存在 $\varphi$-不变补空间, 即存在 $\varphi$-不变子空间 $W$, 使得 $V=\mathrm{Im}(\varphi-\lambda_0I_V)\oplus W$.
证明 由引理 1 可知, 无论是充分性还是必要性, 我们只要选取 (E1)--(E9) 中的一个等价条件来证明即可.
必要性 设 $\varphi$ 可对角化, 即存在 $V$ 的一组基 $\{e_1,e_2,\cdots,e_n\}$, 使得 $\varphi$ 在这组基下的表示矩阵为对角阵 $\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$, 不妨设 $\lambda_1=\cdots=\lambda_r=\lambda_0$, $\lambda_j\neq\lambda_0\,(r<j\leq n)$. 由表示矩阵的定义可知 $\varphi(e_i)=\lambda_ie_i\,(1\leq i\leq n)$, 通过简单的验证可得 $\mathrm{Ker}(\varphi-\lambda_0I_V)=L(e_1,\cdots,e_r)$, $\mathrm{Im}(\varphi-\lambda_0I_V)=L(e_{r+1},\cdots,e_n)$, 于是 (E1) 成立.
充分性 对应于不同的等价条件, 我们给出几种不同的证法.
从 (E3) 出发: 用反证法, 设 $\varphi$ 不可对角化, 则由 (D6) 可知, 存在 $V$ 的一组基 $\{e_1,e_2,\cdots,e_n\}$, 使得 $\varphi$ 在这组基下的表示矩阵为 Jordan 标准型 $\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$, 且至少有一个 Jordan 块的阶数大于 1. 不妨设 $r_1>1$, 则由表示矩阵的定义可知 $$\varphi(e_1)=\lambda_1e_1,\,\,\,\,\varphi(e_2)=e_1+\lambda_1e_2.$$ 于是 $(\varphi-\lambda_1I_V)(e_1)=0$, $(\varphi-\lambda_1I_V)(e_2)=e_1$, 从而 $$0\neq e_1\in\mathrm{Ker}(\varphi-\lambda_1I_V)\cap\mathrm{Im}(\varphi-\lambda_1I_V),$$ 这与已知矛盾.
从 (E5) 出发: 由 $\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\mathrm{Ker}(\varphi-\lambda_0I_V)^n$ 可知, $\lambda_0$ 的根子空间等于其特征子空间. 因为全空间 $V$ 可以分解为根子空间的直和, 故全空间 $V$ 也是特征子空间的直和, 从而由判定准则 (D3) 即得结论.
从 (E5) 出发: 由 $\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n$ 可知, $\lambda_0$ 的几何重数 $\dim\mathrm{Ker}(\varphi-\lambda_0I_V)$ 等于其代数重数 $\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n$, 从而由判定准则 (D4) 即得结论.
从 (E5) 出发: 设 $\varphi$ 的全体不同特征值为 $\lambda_1,\lambda_2,\cdots,\lambda_k$, $\varphi$ 的特征多项式为 $$f(\lambda)=(\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2}\cdots(\lambda-\lambda_k)^{m_k},$$ 则对任意的 $\alpha\in V$, 由 Cayley-Hamilton 定理可知 $$(\varphi-\lambda_1I_V)^{m_1}(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0,$$ 即 $(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)\in\mathrm{Ker}(\varphi-\lambda_1I_V)^{m_1}=\mathrm{Ker}(\varphi-\lambda_1I_V)$, 从而 $$(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0.$$ 不断这样做下去, 最终可得对任意的 $\alpha\in V$, 总有 $$(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)\cdots(\varphi-\lambda_kI_V)(\alpha)=0,$$ 即 $\varphi$ 适合多项式 $g(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_k)$, 从而 $\varphi$ 的极小多项式 $m(\lambda)\mid g(\lambda)$. 又由极小多项式的性质可知 $g(\lambda)\mid m(\lambda)$, 于是 $m(\lambda)=g(\lambda)$ 无重根, 从而由判定准则 (D5) 即得结论.
从 (E6) 出发: 用反证法, 设 $\varphi$ 不可对角化, 则由 (D6) 可知, $\varphi$ 的 Jordan 标准型 $J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$ 中至少有一个 Jordan 块的阶数大于 1. 不妨设 $r_1>1$, 则有 $r(J_{r_1}(\lambda_1)-\lambda_1I_{r_1})=r_1-1$, 而 $r((J_{r_1}(\lambda_1)-\lambda_1I_{r_1})^2)=r_1-2$. 由矩阵秩的基本不等式可知, $r(J-\lambda_1I_n)>r((J-\lambda_1I_n)^2)$, 即有 $r(\varphi-\lambda_1I_V)>r((\varphi-\lambda_1I_V)^2)$, 这与已知矛盾. $\Box$
推论 1 设 $\varphi$ 是 $n$ 维复线性空间 $V$ 上的线性变换, 则 $\varphi$ 可对角化的充要条件是 $V$ 的任一 $\varphi$-不变子空间都存在 $\varphi$-不变补空间, 即对任一 $\varphi$-不变子空间 $U$, 都存在 $\varphi$-不变子空间 $W$, 使得 $V=U\oplus W$.
证明 充分性可由定理 1 的 (E8) 或 (E9) 得到. 再证必要性, 因为 $\varphi$ 可对角化, 故由 (D1) 可知, 存在 $V$ 的一组基 $\{e_1,e_2,\cdots,e_n\}$, 它们都是 $\varphi$ 的特征向量. 由高代教材的推论 7.6.3 可知, $\varphi$ 在不变子空间 $U$ 上的限制 $\varphi|_U$ 也可对角化, 故同理存在 $U$ 的一组基 $\{\alpha_1,\cdots,\alpha_r\}$, 它们也都是 $\varphi$ 的特征向量. 由基扩张定理的证明可知, 我们可从 $\{e_1,e_2,\cdots,e_n\}$ 中取出 $n-r$ 个向量, 不妨设为 $e_{r+1},\cdots,e_n$, 使得 $\{\alpha_1,\cdots,\alpha_r,e_{r+1},\cdots,e_n\}$ 成为 $V$ 的一组新基. 令 $W=L(e_{r+1},\cdots,e_n)$, 则 $W$ 是 $\varphi$-不变子空间且满足 $V=U\oplus W$. $\Box$
推论 2 设 $\varphi$ 是数域 $\mathbb{K}$ 上 $n$ 维线性空间 $V$ 上的线性变换 (或 $A$ 是数域 $\mathbb{K}$ 上的 $n$ 阶方阵), 并且 $\varphi$ (或 $A$) 的所有特征值都在 $\mathbb{K}$ 中, 则 $\varphi$ (或 $A$) 可对角化的判定准则 (D1)--(D6) 以及 (E1)--(E9) 在数域 $\mathbb{K}$ 上也成立.
证明 与复数域 $\mathbb{C}$ 上的证明完全类似, 具体细节留给读者自己完成. $\Box$
注 2 定理 1 在复旦大学高等代数习题课教学视频 [3] 的第 16 讲“可对角化的判定 (下)”中作为例 9 出现, 它是高代白皮书的例 7.13 和例 7.14 的自然推广. 推论 1 是高代白皮书的例 7.15.
接下去, 我们将不利用酉相似标准型理论和正交相似标准型理论, 而利用定理 1 直接证明复正规阵可对角化以及实对称阵可实对角化这两个重要结论.
引理 2 设 $A$ 为 $m\times n$ 阶复矩阵, 则 $r(\overline{A}'A)=r(A\overline{A}')=r(A)$.
证明 这是高代白皮书的例 3.72 的复版本, 其证明完全类似. $\Box$
引理 3 设 $A$ 为 $n$ 阶复正规阵, 即满足 $A\overline{A}'=\overline{A}'A$, 则 $r(A)=r(A^2)$.
证明 若 $A$ 是 Hermite 阵, 即满足 $\overline{A}'=A$, 则由引理 2 可知 $r(A)=r(A^2)$. 若 $A$ 是复正规阵, 注意到 $A\overline{A}'$ 是 Hermite 阵, 则由引理 2 可得 $$r(A^2)=r(A^2\overline{A^2}')=r(AA\overline{A}'\overline{A}')=r(A\overline{A}'A\overline{A}')=r((A\overline{A}')^2)=r(A\overline{A}')=r(A),$$ 结论得证. $\Box$
引理 4 设 $A$ 为 $n$ 阶复正规阵, $\lambda_0$ 是 $A$ 的特征值, 则 $A-\lambda_0I_n$ 也是复正规阵.
证明 由复正规阵的定义验证即得. $\Box$
推论 3 复正规阵可对角化. 特别地, 实对称阵, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, 酉阵均可复对角化.
证明 由引理 4, 引理 3 以及定理 1 (E6) 即得结论. $\Box$
引理 5 实对称阵的特征值全为实数.
证明 设 $A$ 为 $n$ 阶实对称阵, $\lambda_0\in\mathbb{C}$ 是 $A$ 的任一特征值, $\alpha=(a_1,a_2,\cdots,a_n)'\in\mathbb{C}^n$ 是对应的特征向量, 即 $A\alpha=\lambda_0\alpha$. 上式两边同时左乘 $\overline{\alpha}'$, 则有 $\overline{\alpha}'A\alpha=\lambda_0\overline{\alpha}'\alpha$. 注意到 $\alpha$ 是非零向量, 故 $\overline{\alpha}'\alpha=\sum\limits_{i=1}^n|a_i|^2>0$. 注意到 $A$ 为实对称阵, 故 $\overline{(\overline{\alpha}'A\alpha)}'=\overline{\alpha}'A\alpha$, 即 $\overline{\alpha}'A\alpha$ 是一个实数, 从而 $\lambda_0=\dfrac{\overline{\alpha}'A\alpha}{\overline{\alpha}'\alpha}$ 也是实数. $\Box$
推论 4 实对称阵在实数域上可对角化.
证法 1 设 $A$ 为实对称阵, 由高代白皮书的例 3.72 可得 $r(A)=r(A^2)$. 再由引理 5 可知, $A$ 的特征值全为实数, 于是根据推论 2 可得 $A$ 在实数域上可对角化.
证法 2 由推论 3 可知实对称阵可复对角化, 又其特征值全为实数, 故实对称阵复相似于实对角阵. 再由高代教材的推论 7.3.4 (相似关系在基域扩张下的不变性) 可知, 实对称阵可实对角化. $\Box$
注 3 推论 3 和推论 4 是教学博文 [4] 的主要结果, 其证明的关键点也是本文的引理 3 以及定理 1 的类似思想.
我们将推论 3 和推论 4 合并起来, 补充如下的可对角化判定准则:
(D7) 若复方阵相似于复正规阵, 则可对角化; 若实方阵实相似于实对称阵, 则可实对角化.
我们先给出一个相似于复正规阵的例子.
例 1 (白皮书的例 6.33) 设 $n$ 阶复方阵 $A$ 可对角化, 证明: 矩阵 $\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}$ 也可对角化.
证明 设 $P$ 为非异阵, 使得 $P^{-1}AP=\Lambda$ 为对角阵. 考虑相似变换 $$\begin{pmatrix} P^{-1} & 0 \\ 0 & P^{-1} \\ \end{pmatrix}\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}\begin{pmatrix} P & 0 \\ 0 & P \\ \end{pmatrix}=\begin{pmatrix} \Lambda & \Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix},$$ 通过简单的验证可知, $\begin{pmatrix} \Lambda & \Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix}$ 是复正规阵, 故由判定准则 (D7) 可知结论成立. $\Box$
最后, 我们给出一个相似于实对称阵的例子, 更多的例题请参考高代白皮书的例 9.63--例 9.65.
例 2 (白皮书的例 6.40) 设 $a,b,c$ 为复数且 $bc\neq 0$, 证明下列三对角矩阵可对角化: $$T(a,b,c)=\begin{pmatrix} a & b & & & & \\ c & a & b & & & \\ & c & a & b & & \\ & & \ddots & \ddots & \ddots & \\ & & & c & a & b \\ & & & & c & a \\ \end{pmatrix}.$$
证明 要证 $T(a,b,c)$ 可对角化, 只要证 $T(a,b,c)-aI_n=T(0,b,c)$ 可对角化即可, 故不妨设 $a=0$. 由于 $bc\neq 0$, 故对 $T(0,b,c)$ 实施如下的相似初等变换: 依次将第 $i+1$ 行乘以 $\sqrt{\bigg(\dfrac{b}{c}\bigg)^i}$, 再将第 $i+1$ 列乘以 $\sqrt{\bigg(\dfrac{c}{b}\bigg)^i}$ $(1\leq i\leq n-1)$, 可得 $T(0,b,c)$ 复相似于 $T(0,\sqrt{bc},\sqrt{bc})=\sqrt{bc}\cdot T(0,1,1)$. 因为 $T(0,1,1)$ 是实对称阵, 故可对角化, 从而 $T(a,b,c)$ 也可对角化. $\Box$
参考文献
[1] 高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.
[2] 高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.
[3] 谢启鸿, 复旦大学高等代数习题课教学视频, https://www.bilibili.com/video/av90771191/
[4] 谢启鸿, 实对称阵可对角化的几种证明及其推广, https://www.cnblogs.com/torsor/p/6785447.html