复旦大学2023--2024学年第二学期(23级)高等代数II期末考试第八大题解答
八、(10分) 设 $A$ 为 $n$ 阶非异复矩阵, 证明: 矩阵方程 $X^2=A$ 只有有限个解的充要条件是 $A$ 的极小多项式等于其特征多项式.
证明 注意到题目的条件和结论在同时相似变换 $A\mapsto P^{-1}AP$, $X\mapsto P^{-1}XP$ 下不改变, 故不妨从一开始就假设
$$A=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$$
为 Jordan 标准型, 其中 $\lambda_i\neq 0\,(1\leq i\leq k)$.
充分性 若 $A$ 的极小多项式等于特征多项式, 则 $A$ 的各个 Jordan 块的特征值互不相同, 即 $\lambda_1,\lambda_2$, $\cdots$, $\lambda_k$ 互不相同. 由 $X^2=A$ 可知 $XA=X^3=AX$, 故由高代白皮书例 6.90 可知 $X=\mathrm{diag}\{X_1,X_2$, $\cdots$, $X_k\}$, 其中 $X_i$ 是 $r_i$ 阶矩阵, 且满足 $X_i^2=J_{r_i}(\lambda_i)\,(1\leq i\leq k)$. 注意到
$$X_iJ_{r_i}(\lambda_i)=X_i^3=J_{r_i}(\lambda_i)X_i,$$
故由高代白皮书例 7.29 可知, $X_i$ 可表示为 $N=J_{r_i}(0)$ 的不超过 $r_i-1$ 次的多项式.
充分性证法一 设
$$X_i=a_0I_{r_i}+a_1N+\cdots+a_{r_i-1}N^{r_i-1},$$
则有
$$\lambda_iI_{r_i}+N=J_{r_i}(\lambda_i)=X_i^2=$$
$$a_0^2I_{r_i}+2a_0a_1N+(2a_0a_2+a_1^2)N^2+(2a_0a_3+2a_1a_2)N^3+\cdots+(2a_0a_{r_i-1}+\cdots)N^{r_i-1}.$$
比较等式左右两边矩阵中的元素, 由 $a_0^2=\lambda_i$ 可得 $a_0=\pm\sqrt{\lambda_i}$; 由 $2a_0a_1=1$ 可得 $a_1=\dfrac{1}{2a_0}$; 由 $2a_0a_2+a_1^2=0$ 可得 $a_2=-\dfrac{a_1^2}{2a_0}=-\dfrac{1}{8a_0^3}$; 由 $2a_0a_3+2a_1a_2=0$ 可得 $a_3=-\dfrac{a_1a_2}{a_0}=\dfrac{1}{16a_0^5}$; $\cdots$; 最后可得 $a_{r_i-1}$ 可表示为 $a_0$ 的奇有理函数 (比如用归纳法来证). 因此, $X_i^2=J_{r_i}(\lambda_i)$ 只有两个解, 从而 $X^2=A$ 只有 $2^k$ 个解, 当然只有有限个解.
充分性证法二 由高代白皮书例 7.72 的证明可知, $X_i^2=J_{r_i}(\lambda_i)$ 至少有两个解 $B_1,B_2$, 它们分别相似于 $J_{r_i}(\pm\sqrt{\lambda_i})$. 现任取 $X_i^2=J_{r_i}(\lambda_i)$ 的一个解 $B$, 则由高代白皮书例 7.54 可知, $B$ 的 Jordan 标准型必为 $J_{r_i}(\pm\sqrt{\lambda_i})$ 之一, 故不妨设 $B$ 相似于 $B_1$, 即存在非异阵 $P$, 使得 $B=P^{-1}B_1P$, 于是
$$J_{r_i}(\lambda_i)=B^2=(P^{-1}B_1P)^2=P^{-1}B_1^2P=P^{-1}J_{r_i}(\lambda_i)P,$$
即 $PJ_{r_i}(\lambda_i)=J_{r_i}(\lambda_i)P$, 从而 $P$ 可表示为 $N=J_{r_i}(0)$ 的多项式. 因为 $B_1$ 也可表示为 $N=J_{r_i}(0)$ 的多项式, 所以 $B_1P=PB_1$, 于是 $B=P^{-1}B_1P=P^{-1}PB_1=B_1$. 因此, $X_i^2=J_{r_i}(\lambda_i)$ 只有两个解 $B_1,B_2$, 从而 $X^2=A$ 只有 $2^k$ 个解, 当然只有有限个解.
必要性 若 $A$ 的极小多项式不等于特征多项式, 则至少有两个 Jordan 块有相同的特征值, 不妨设 $\lambda_1=\lambda_2$. 由充分性的证明可知, 存在 $r_i$ 阶矩阵 $X_i$, 使得 $X_i^2=J_{r_i}(\lambda_i)\,(1\leq i\leq k)$, 并且 $X_1$ 的特征值为 $\sqrt{\lambda_1}$, $X_2$ 的特征值为 $-\sqrt{\lambda_1}$. 令
$$X=\mathrm{diag}\left\{\begin{pmatrix} X_1 & Y \\ O & X_2 \\ \end{pmatrix},X_3,\cdots,X_k\right\},$$
则
$$X^2=\mathrm{diag}\left\{\begin{pmatrix} X_1^2 & X_1Y+YX_2 \\ O & X_2^2 \\ \end{pmatrix},X_3^2,\cdots,X_k^2\right\}.$$
只要 $X_1Y+YX_2=O$, 则有 $X^2=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}=A$ 成立. 注意到矩阵方程 $X_1Y+YX_2=O$ 等价于 $X_1Y=Y(-X_2)$, 其中 $X_1$ 与 $-X_2$ 有公共的特征值 $\sqrt{\lambda_1}$, 从而由高代白皮书例 6.91 可知, 上述矩阵方程的解空间非零, 即维数大于等于 1, 从而 $Y$ 以及 $X$ 均有无穷多个解. 具体地, $Y=kB\,(k\in\mathbb{K})$ 都是矩阵方程 $X_1Y+YX_2=0$ 的解, 其中 $B$ 是 $r_1\times r_2$ 矩阵, 其 $(1,r_2)$ 元素等于 1, 其余元素都等于 0. $\Box$
注 由高代白皮书例 7.72 可知, 假设 $A$ 为非异阵是为了保证矩阵方程 $X^2=A$ 有解. 如果我们直接假设解的存在性, 那么便可将本题推广到一般的情形, 其证明留给读者完成.
推广 设 $A$ 为 $n$ 阶复矩阵, 使得矩阵方程 $X^2=A$ 有解. 证明: $X^2=A$ 只有有限个解的充要条件是 $A$ 的极小多项式等于其特征多项式.