复旦大学数学学院18级高等代数II期中考试第五大题的三种证法及其推广

第五大题  设 $A_1,\cdots,A_n$ 为两两乘法可交换的 2019 阶实方阵, $f(x_1,\cdots,x_n)$ 是 $n$ 元实系数多项式. 令 $B=f(A_1,\cdots,A_n)$, 证明: 存在 $B$ 的某个特征值 $\lambda_0$, 使得方程 $f(x_1,\cdots,x_n)-\lambda_0=0$ 有一组实数解.

证明  先利用下面的引理证明本题的结论, 然后再证明引理. 由于 $A_1,\cdots,A_n$ 是两两乘法可交换的 2019 阶实矩阵, 故由引理可知: 存在 $\lambda_1,\cdots,\lambda_n\in\mathbb{R}$ 和 $0\neq \alpha\in\mathbb{R}^{2019}$, 使得 $A_i\alpha=\lambda_i\alpha\,(1\leq i\leq n)$. 于是 $$B\alpha=f(A_1,\cdots,A_n)\alpha=f(\lambda_1,\cdots,\lambda_n)\alpha,$$ 从而 $\lambda_0=f(\lambda_1,\cdots,\lambda_n)$ 是 $B$ 的一个特征值, 方程 $f(x_1,\cdots,x_n)=\lambda_0$ 有一组实数解 $x_1=\lambda_1,\cdots,x_n=\lambda_n$.  $\Box$

引理  设 $A_1,A_2,\cdots,A_n$ 为两两乘法可交换的 $m$ 阶实方阵, 其中 $m$ 为奇数, 则 $A_1,A_2,\cdots,A_n$ 必有一个公共的实特征向量.

分析  高代教材第 270 页的习题 9 或高代白皮书的例 6.25 告诉我们: 两两乘法可交换的一组复矩阵必有一个公共的复特征向量, 上述引理正是这一结论的实数域版本. 容易看出: 如果没有奇数阶的限制, 实数域版本的结论一般并不成立, 例如 $A_1=\begin{pmatrix} 0 & 1 \\ -1 & 0 \\ \end{pmatrix}$, $A_2=I_2$. 设两个复方阵 $A,B$ 乘法可交换, 则 $A$ 的特征子空间必为 $B$ 的不变子空间 (将矩阵和线性变换等同起来), 这一基本结论是处理众多 $AB=BA$ 型问题的出发点. 由高代白皮书例 6.25 的证明过程可知, 复数版本的证明方法是: 由基本结论可将 $A_2,\cdots,A_n$ 限制在 $A_1$ 的某个特征子空间上, 然后再对个数进行归纳即可. 如果将复数域版本的证明方法直接移植到实数域版本, 读者不难发现: 奇数维实线性空间上的实线性变换, 它的实特征子空间不一定是奇数维的, 从而无法采用归纳法进行讨论. 下面我们给出上述引理的三种证法 (证法一由桑元琦博士后提供, 证法二参考教学论文 [3] 的例 3, 证法三由复旦大学数学学院 11 级王晋民同学提供), 它们都能克服这一技术性的难点.

证明  对 $n$ 进行归纳. 当 $n=1$ 时, $A_1$ 是奇数阶实矩阵, 其特征多项式是奇数次实系数多项式. 因为实系数多项式虚根成对出现, 故 $A_1$ 的特征多项式至少有一个实根, 即 $A_1$ 至少有一个实特征值, 从而至少有一个实特征向量. 设对 $n-1$ 个两两乘法可交换的奇数阶实矩阵, 它们必有一个公共的实特征向量, 现考虑 $n$ 个两两乘法可交换的奇数阶实矩阵的情形.

证法一  首先, $A_1$ 必有一个代数重数为奇数的实特征值. 否则, 若 $A_1$ 的所有实特征值的代数重数都为偶数, 又共轭虚特征值的代数重数相等, 从而 $A_1$ 的阶数必为偶数, 矛盾! 设 $\lambda_1$ 是 $A_1$ 的实特征值, 其代数重数 $m_1$ 为奇数, 设 $A_1$ 的特征多项式 $f(\lambda)=|\lambda I_m-A_1|=(\lambda-\lambda_1)^{m_1}g(\lambda)$, 则 $(\lambda-\lambda_1)^{m_1}$ 与 $g(\lambda)$ 互素. 将实矩阵和实线性变换等同起来, 令 $$R_1=\mathrm{Ker}(A_1-\lambda_1I_m)^{m_1}\subseteq\mathbb{R}^m,\,\,\,\,K_1=\mathrm{Ker}g(A_1)\subseteq\mathbb{R}^m,$$ 则由高代白皮书的例 6.69 可知 $\mathbb{R}^m=R_1\oplus K_1$, 并且 $A_1$ 在不变子空间 $R_1$ 上的限制 $\widetilde{A_1}$ 的特征多项式就是 $(\lambda-\lambda_1)^{m_1}$. 特别地, $\dim R_1=m_1$, 即 $R_1$ 是一个奇数维实线性空间. 由 $A_1,A_2,\cdots,A_n$ 两两乘法可交换, 容易验证 $R_1$ 也是 $A_2,\cdots,A_n$ 的不变子空间, 对 $A_2,\cdots,A_n$ 在 $R_1$ 上的限制 $\widetilde{A_2},\cdots,\widetilde{A_n}$ 利用归纳假设可知, 存在 $\lambda_2,\cdots,\lambda_n\in\mathbb{R}$, 使得 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})\neq 0$. 注意到 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})\subseteq R_1$ 是 $\widetilde{A_1}$-不变子空间, 并且 $\widetilde{A_1}$ 限制在 $\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})$ 上只有一个实特征值 $\lambda_1$, 从而存在对应的实特征向量 $\alpha\in\bigcap\limits_{i=2}^n\mathrm{Ker}(\widetilde{A_i}-\lambda_iI_{R_1})$, 于是 $\alpha$ 就是 $\widetilde{A_1},\widetilde{A_2},\cdots,\widetilde{A_n}$ (也即 $A_1,A_2,\cdots,A_n$) 公共的实特征向量.

证法二  设 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r},\lambda_{r+1},\cdots,\lambda_k$ 为 $A_1$ 的全体不同特征值, 其中 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r}$ 为共轭虚特征值, $\lambda_{r+1},\cdots,\lambda_k$ 为实特征值, 则由 Jordan 标准型理论可知 $$\mathbb{C}^m=R(\lambda_1)\oplus R(\overline{\lambda_1})\oplus\cdots\oplus R(\lambda_r)\oplus R(\overline{\lambda_r})\oplus R(\lambda_{r+1})\oplus\cdots\oplus R(\lambda_k),$$ 其中 $R(\lambda_i)$ 是特征值 $\lambda_i$ 的根子空间, $\dim R(\lambda_i)=m_i\,(1\leq i\leq k)$. 由矩阵秩的子式判别法可知, 复矩阵的秩在共轭下不改变, 故对任意的 $1\leq i\leq r$, $$\dim R(\lambda_i)=m-r((A_1-\lambda_iI_m)^{m_i})=m-r((A_1-\overline{\lambda_i}I_m)^{m_i})=\dim R(\overline{\lambda_i}).$$ 再由 $m$ 为奇数可知, 存在 $r+1\leq j\leq k$, 使得 $\dim R(\lambda_j)$ 为奇数. 不妨设 $\dim R(\lambda_k)=m_k$ 为奇数, 注意这是复线性子空间的复维数. 设 $$R_k=\{\alpha\in\mathbb{R}^m\mid (A_1-\lambda_kI_m)^{m_k}\alpha=0\}\subseteq\mathbb{R}^m,$$ 由矩阵秩的子式判别法可知, 矩阵的秩在基域扩张下不改变 (参考论文 [1]), 故 $$\dim_{\mathbb{R}} R_k=m-r_{\mathbb{R}}((A_1-\lambda_kI_m)^{m_k})=m-r_{\mathbb{C}}((A_1-\lambda_kI_m)^{m_k})=\dim_{\mathbb{C}} R(\lambda_k)=m_k,$$ 于是 $R_k$ 是一个奇数维的实线性空间. 将实矩阵和实线性变换等同起来, 由 $A_1,A_2,\cdots,A_n$ 两两乘法可交换, 容易验证 $R_k$ 是 $A_2,\cdots,A_n$ 的不变子空间. 记 $A_2,\cdots,A_n$ 在 $R_k$ 上的限制为 $\widetilde{A_2},\cdots,\widetilde{A_n}$, 则由归纳假设可知, 它们存在公共的实特征向量, 即存在 $0\neq\beta\in R_k$, 使得 $A_i\beta=\mu_i\beta\,(2\leq i\leq n)$. 设 $$s=\max\{i\in\mathbb{Z}^{\geq 0}\mid (A_1-\lambda_kI_n)^i\beta\neq 0\},$$ 令 $\alpha=(A_1-\lambda_kI_n)^s\beta$, 则 $0\neq\alpha\in R_k$ 且 $(A_1-\lambda_kI_n)\alpha=(A_1-\lambda_kI_n)^{s+1}\alpha=0$, 即有 $A_1\alpha=\lambda_k\alpha$. 再由 $A_1$ 与 $A_2,\cdots,A_n$ 乘法可交换可知 $A_i\alpha=\mu_i\alpha\,(2\leq i\leq n)$, 于是 $\alpha$ 就是 $A_1,A_2,\cdots,A_n$ 公共的实特征向量.

证法三  先考虑 $A_1$ 复可对角化的情形. 设 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r},\lambda_{r+1},\cdots,\lambda_k$ 为 $A_1$ 的全体不同特征值, 其中 $\lambda_1,\overline{\lambda_1},\cdots,\lambda_r,\overline{\lambda_r}$ 为共轭虚特征值, $\lambda_{r+1},\cdots,\lambda_k$ 为实特征值, 则由 $A_1$ 复可对角化可知 $$\mathbb{C}^m=V_{\lambda_1}\oplus V_{\overline{\lambda_1}}\oplus\cdots\oplus V_{\lambda_r}\oplus V_{\overline{\lambda_r}}\oplus V_{\lambda_{r+1}}\oplus\cdots\oplus V_{\lambda_k},$$ 其中 $V_{\lambda_i}$ 是特征值 $\lambda_i$ 的特征子空间. 由矩阵秩的子式判别法可知, 复矩阵的秩在共轭下不改变, 故对任意的 $1\leq i\leq r$, $$\dim V_{\lambda_i}=m-r(A_1-\lambda_iI_m)=m-r(A_1-\overline{\lambda_i}I_m)=\dim V_{\overline{\lambda_i}}.$$ 再由 $m$ 为奇数可知, 存在 $r+1\leq j\leq k$, 使得 $\dim V_{\lambda_j}$ 为奇数. 不妨设 $\dim V_{\lambda_k}$ 为奇数, 注意这是复线性子空间的复维数. 设 $$V_k=\{\alpha\in\mathbb{R}^m\mid (A_1-\lambda_kI_m)\alpha=0\}\subseteq\mathbb{R}^m,$$ 由矩阵秩的子式判别法可知, 矩阵的秩在基域扩张下不改变 (参考论文 [1]), 故 $$\dim_{\mathbb{R}} V_k=m-r_{\mathbb{R}}(A_1-\lambda_kI_m)=m-r_{\mathbb{C}}(A_1-\lambda_kI_m)=\dim_{\mathbb{C}} V_{\lambda_k},$$ 于是 $V_k$ 是一个奇数维的实线性空间. 将实矩阵和实线性变换等同起来, 由 $A_1,A_2,\cdots,A_n$ 两两乘法可交换, 容易验证 $V_k$ 是 $A_2,\cdots,A_n$ 的不变子空间. 记 $A_2,\cdots,A_n$ 在 $V_k$ 上的限制为 $\widetilde{A_2},\cdots,\widetilde{A_n}$, 则由归纳假设可知, $\widetilde{A_2},\cdots,\widetilde{A_n}$ 存在公共的实特征向量 $\alpha\in V_k$, 从而 $\alpha$ 是 $A_1,A_2,\cdots,A_n$ 公共的实特征向量.

再处理一般的情形. 由 Jordan-Chevalley 分解定理, $A_1=B+C$, 其中 $B$ 为可对角化矩阵, $C$ 为幂零矩阵, $BC=CB$, 且 $B,C$ 均可表示为 $A$ 的多项式. 考虑到 $A_1$ 为实矩阵, 求共轭后可得 $A_1=\overline{B}+\overline{C}$, 易证这个分解仍满足 Jordan-Chevalley 分解的条件. 由 Jordan-Chevalley 分解的唯一性可知, $\overline{B}=B$, $\overline{C}=C$, 即 $B,C$ 都是实矩阵 (也可以直接引用高代白皮书的例 7.69). 由于 $B$ 是 $A_1$ 的多项式, 故 $B,A_2,\cdots,A_n$ 是两两乘法可交换的奇数阶实方阵, 由前面的讨论可知, $B,A_2,\cdots,A_n$ 存在公共的实特征向量 $\beta$, 即有 $B\beta=\mu_1\beta$, $A_i\beta=\mu_i\beta\,(2\leq i\leq n)$. 设 $$s=\max\{i\in\mathbb{Z}^{\geq 0}\mid C^i\beta\neq 0\},$$ 令 $\alpha=C^s\beta$, 则 $0\neq\alpha\in\mathbb{R}^m$ 且 $C\alpha=C^{s+1}\beta=0$, $$B\alpha=BC^s\beta=C^sB\beta=\mu_1C^s\beta=\mu_1\alpha,$$ 从而 $A_1\alpha=B\alpha+C\alpha=\mu_1\alpha$. 由于 $C$ 是 $A_1$ 的多项式, 故 $C$ 与 $A_2,\cdots,A_n$ 乘法可交换, 从而 $$A_i\alpha=A_iC^s\beta=C^sA_i\beta=\mu_iC^s\beta=\mu_i\alpha\,(2\leq i\leq n),$$ 即 $\alpha$ 是 $A_1,A_2,\cdots,A_n$ 公共的实特征向量.  $\Box$

点评  证法一和证法二的整体思路是一致的, 都是用实特征值的根子空间代替特征子空间进行讨论, 但在证明根子空间的维数为奇数以及构造公共的实特征向量这两个关键点上采用了不同的方法. 证法三利用 Jordan-Chevalley 分解定理把证明化简为其中一个实矩阵复可对角化的情形, 从而仍然沿用特征子空间的讨论方法, 最后在构造公共的实特征向量这个关键点上与证法二完全类似. 总的来说, 证法一只用了实线性变换理论, 从而证明过程最简洁; 证法二和证法三都用了复矩阵的 Jordan 标准型理论 (包括 Jordan-Chevalley 分解定理), 并利用了矩阵秩在基域扩张下的不变性, 虽然证明过程有点长, 但给出了实矩阵和复矩阵之间的区别与联系, 值得读者细细品味.

最后, 我们给出一个推论, 它将引理从一组矩阵推广为一族矩阵 (个数可以是无限个).

推论  设 $\{A_i\}_{i\in I}$ 是一族两两乘法可交换的复矩阵 (奇数阶实矩阵), 则 $\{A_i\}_{i\in I}$ 必有一个公共的复 (实) 特征向量.

证明  令 $V=L(A_i,\,i\in I)$ 为这族矩阵张成的矩阵空间. 设 $\dim V=n$, $\{B_1,\cdots,B_n\}$ 为 $V$ 的一组基, 容易验证: $B_1,\cdots,B_n$ 是一组两两乘法可交换的复矩阵 (奇数阶实矩阵), 则由高代白皮书的例 6.25 (上述引理) 可知, $B_1,\cdots,B_n$ 有一个公共的复 (实) 特征向量, 从而 $\{A_i\}_{i\in I}$ 有一个公共的复 (实) 特征向量.  $\Box$

参考文献

[1]  高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.

[2]  高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.

[3]  谢启鸿, 高等代数中若干概念在基域扩张下的不变性, 大学数学, 2015, 31(6), 50–55.

posted @ 2020-02-06 19:32  torsor  阅读(2871)  评论(0编辑  收藏  举报