复旦大学数学学院18级高等代数II期中考试第七大题的三种证法及其推广

第七大题  设 $A$ 为 $n$ 阶复方阵, 证明: 存在复数 $c_1,\cdots,c_{n-1}$, 使得 $$A-c_1e^A-c_2e^{2A}-\cdots-c_{n-1}e^{(n-1)A}$$ 是可对角化矩阵.

本题是复旦大学数学学院 18 级高等代数 II 期中考试的第七大题, 虽然结论涉及矩阵的多项式表示和可对角化矩阵, 但考察的重点其实是矩阵 Jordan 标准型的应用. 本题有三种证法, 第一种证法就是 Jordan 标准型的应用, 整个证明过程类似于 Jordan-Chevalley 分解定理的证明. 注意在“三段论法”的第一步, 我们并非只证明单个 Jordan 块的情形, 而需要将相差 $2k\pi\mathrm{i}\,(k\in\mathbb{Z})$ 的特征值的所有 Jordan 块放在一起考虑. 第二种证法 (由但晖博士后提供) 直接利用 Jordan-Chevalley 分解定理来证明, 先处理幂零矩阵的情形, 再处理一般的情形. 第三种证法 (由 18 级周烁星同学提供) 另辟蹊径, 只利用 Jordan 块的基本性质和 Hermite-Lagrange 多重插值公式就给出了一个简洁的证明.

定义  两个复数 $\lambda,\mu$ 称为等价的, 如果 $e^\lambda=e^\mu$, 即 $\lambda-\mu=2k\pi\mathrm{i}\,(k\in\mathbb{Z})$.

证法一 (Jordan 标准型的应用)  设 $P$ 为非异阵, 使得 $P^{-1}AP=J=\mathrm{diag}\{J_1,J_2,\cdots,J_k\}$ 为 Jordan 标准型, 其中 $[\lambda_1],[\lambda_2],\cdots,[\lambda_k]$ 是 $A$ 的特征值的等价类全体, 与 $\lambda_i$ 等价的所有特征值的 Jordan 块拼成的分块对角阵为 $J_i$, 其阶数设为 $n_i\,(1\leq i\leq k)$. 以下按照“三段论法”来进行讨论 (参考高代白皮书的第 7.2.8 节). 

Step 1  任取 $J_i$ 中某一 Jordan 块 $J_{r_i}(\lambda_i)$, 由高代教材第 333 页的第二行公式可得: $$e^{jJ_{r_i}(\lambda_i)}=e^{j\lambda_i}\cdot\begin{pmatrix} 1 & \dfrac{j}{1!} & \dfrac{j^2}{2!} & \cdots & \dfrac{j^{r_i-1}}{(r_i-1)!} \\ & 1 & \dfrac{j}{1!} & \ddots & \vdots \\ & & \ddots & \ddots & \dfrac{j^2}{2!} \\ & & & \ddots & \dfrac{j}{1!} \\ & & & & 1\\ \end{pmatrix}.$$ 若设 $$(1)\quad J_{r_i}(\lambda_i)=c_0I_{r_i}+c_1e^{J_{r_i}(\lambda_i)}+c_2e^{2J_{r_i}(\lambda_i)}+\cdots+c_{n-1}e^{(n-1)J_{r_i}(\lambda_i)},$$ 则 (1) 式等价于如下线性方程组, 其中 $d=e^{\lambda_i}\neq 0$: $$(2)\quad\left\{\begin{array}{rcl} c_0+c_1d+c_2d^2+\cdots+c_{n-1}d^{n-1}&=&\lambda_i, \\ c_1\dfrac{d}{1!}+c_2\dfrac{2d^2}{1!}+\cdots+c_{n-1}\dfrac{(n-1)d^{n-1}}{1!}&=&1, \\ c_1\dfrac{d}{2!}+c_2\dfrac{2^2d^2}{2!}+\cdots+c_{n-1}\dfrac{(n-1)^2d^{n-1}}{2!}&=&0, \\ \cdots\cdots&=&0, \\ c_1\dfrac{d}{(r_i-1)!}+c_2\dfrac{2^{r_i-1}d^2}{(r_i-1)!}+\cdots+c_{n-1}\dfrac{(n-1)^{r_i-1}d^{n-1}}{(r_i-1)!}&=&0, \\ \end{array}\right.$$ 其矩阵形式为 $$(3)\quad\begin{pmatrix} 1 & d & d^2 & \cdots & d^{n-1} \\ 0 & \dfrac{d}{1!} & \dfrac{2d^2}{1!} & \cdots & \dfrac{(n-1)d^{n-1}}{1!} \\ 0 & \dfrac{d}{2!} & \dfrac{2^2d^2}{2!} & \cdots & \dfrac{(n-1)^2d^{n-1}}{2!} \\ \vdots & \vdots & \vdots & & \vdots \\ 0 & \dfrac{d}{(r_i-1)!} & \dfrac{2^{r_i-1}d^2}{(r_i-1)!} & \cdots & \dfrac{(n-1)^{r_i-1}d^{n-1}}{(r_i-1)!} \\ \end{pmatrix}\cdot\begin{pmatrix} c_0 \\ c_1 \\ c_2 \\ \vdots \\ c_{n-1} \end{pmatrix}=\begin{pmatrix} \lambda_i \\ 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix}.$$ 设方程组 (3) 的系数矩阵为 $M_{r_i\times n}$, 通过 Vandermonde 行列式易证 $r(M)=r_i$, 即 $M$ 是行满秩阵, 从而由 $M$ 诱导的线性映射是满射, 于是方程组 (3) 必有解, 这等价于存在复数 $c_0,c_1,c_2,\cdots,c_{n-1}$, 使得 (1) 式成立, 即每个 Jordan 块 $J_{r_i}(\lambda_i)$ 都可表示为 $e^{J_{r_i}(\lambda_i)}$ 的多项式.

一般地, 取 $J_i$ 中阶数最大的 Jordan 块 $J_{r_i}(\lambda_i)$ 以及满足 (1) 式的复数 $c_0,c_1,c_2,\cdots,c_{n-1}$. 注意到方程组 (3) 中的矩阵 $M_{r_i\times n}$ 只依赖于 $d=e^{\lambda_i}$, 故对 $J_i$ 中另一 Jordan 块 $J_{r_j}(\lambda_j)$, 其中 $\lambda_i$ 与 $\lambda_j$ 等价且 $r_i\geq r_j$, 则 $M_{r_j\times n}$ 是 $M_{r_i\times n}$ 的子矩阵. 换言之, Jordan 块 $J_{r_j}(\lambda_j)$ 对应的方程组 (2), 除了第一个方程右端是 $\lambda_j$ 之外, 其余方程都是 Jordan 块 $J_{r_i}(\lambda_i)$ 对应的方程组 (2) 的一部分. 由此可得 $$(4)\quad J_{r_j}(\lambda_j)=(c_0+\lambda_j-\lambda_i)I_{r_j}+c_1e^{J_{r_j}(\lambda_j)}+c_2e^{2J_{r_j}(\lambda_j)}+\cdots+c_{n-1}e^{(n-1)J_{r_j}(\lambda_j)}.$$ 令 $$g_i(\lambda)=c_0+c_1\lambda+c_2\lambda^2+\cdots+c_{n-1}\lambda^{n-1}\in\mathbb{C}[\lambda],$$ 则由 (1) 式和 (4) 式可知 $J_i-g_i(e^{J_i})=\Lambda_i$ 为对角阵, 且主对角线上的元素为 $2k\pi\mathrm{i}\,(k\in\mathbb{Z})$.

Step 2  注意到 $e^{J_i}$ 的特征多项式为 $(\lambda-e^{\lambda_i})^{n_i}\,(1\leq i\leq k)$, 它们两两互素, 故由中国剩余定理可知, 存在 $g(\lambda)\in\mathbb{C}[\lambda]$, 使得 $$g(\lambda)=(\lambda-e^{\lambda_i})^{n_i}q_i(\lambda)+g_i(\lambda),\quad 1\leq i\leq k.$$ 设 $e^J=\mathrm{diag}\{e^{J_1},e^{J_2},\cdots,e^{J_k}\}$ 的特征多项式为 $f(\lambda)=\prod\limits_{i=1}^k(\lambda-e^{\lambda_i})^{n_i}$, 则由带余除法可得 $$g(\lambda)=f(\lambda)q(\lambda)+h(\lambda),\quad \deg h(\lambda)<\deg f(\lambda)=n.$$ 由 Cayley-Hamilton 定理可知 $h(e^{J_i})=g(e^{J_i})=g_i(e^{J_i})$, 于是 $J_i-h(e^{J_i})=\Lambda_i$. 令 $\Lambda=\mathrm{diag}\{\Lambda_1,\Lambda_2,\cdots,\Lambda_k\}$, 则 $\Lambda$ 为对角阵, 主对角线上的元素为 $2k\pi\mathrm{i}\,(k\in\mathbb{Z})$, 并且 $$J-h(J)=\mathrm{diag}\{J_1-h(e^{J_1}),J_2-h(e^{J_2}),\cdots,J_k-h(e^{J_k})\}=\Lambda.$$

Step 3  最后, 我们有 $A-h(A)=P(J-h(J))P^{-1}=P\Lambda P^{-1}$, 这是一个可对角化矩阵, 其特征值为 $2k\pi\mathrm{i}\,(k\in\mathbb{Z})$.

证法二 (Jordan-Chevalley 分解定理)  我们分两步来证明, 先处理幂零阵的情形, 再利用 Jordan-Chevalley 分解定理处理一般的情形.

Step 1  先假设 $A$ 为幂零阵, 即 $A^n=0$, 从而有 $$\left\{\begin{array}{ccl} I_n&=&I_n, \\ e^A&=&I_n+A+\dfrac{A^2}{2!}+\cdots+\dfrac{A^{n-1}}{(n-1)!}, \\ e^{2A}&=&I_n+2A+\dfrac{2^2A^2}{2!}+\cdots+\dfrac{2^{n-1}A^{n-1}}{(n-1)!}, \\ \vdots&=&\vdots \\ e^{(n-1)A}&=&I_n+(n-1)A+\dfrac{(n-1)^2A^2}{2!}+\cdots+\dfrac{(n-1)^{n-1}A^{n-1}}{(n-1)!}, \\ \end{array}\right.$$ 即有形式列向量的矩阵乘法: $$(5)\quad \begin{pmatrix} I_n \\ e^A \\ e^{2A} \\ \vdots \\ e^{(n-1)A} \\ \end{pmatrix}=\begin{pmatrix} 1 & 0 & 0 & \cdots & 0 \\ 1 & 1 & \dfrac{1}{2!} & \cdots & \dfrac{1}{(n-1)!} \\ 1 & 2 & \dfrac{2^2}{2!} & \cdots & \dfrac{2^{n-1}}{(n-1)!} \\ \vdots & \vdots & \vdots & & \vdots \\ 1 & n-1 & \dfrac{(n-1)^2}{2!} & \cdots & \dfrac{(n-1)^{n-1}}{(n-1)!} \\ \end{pmatrix}\cdot\begin{pmatrix} I_n \\ A \\ A^2 \\ \vdots \\ A^{n-1} \\ \end{pmatrix}.$$ 注意到 (5) 式右边的 $n$ 阶方阵 $T$ 是一个非异阵 (因其行列式可化为 Vandermonde 行列式), 故可将 $T$ 从 (5) 式的右边移至左边变为 $T^{-1}$. 特别地, 对应形式列向量的矩阵乘法告诉我们: $A$ 可表示为 $e^A$ 的多项式, 从而结论得证.

Step 2  对于一般的情形, 考虑 $A$ 的 Jordan-Chevalley 分解 $A=B+C$, 其中 $B$ 为可对角化矩阵, $C$ 为幂零矩阵, $BC=CB$, 且 $B,C$ 均可表示为 $A$ 的多项式. 根据题目的结论, 我们只要证明 $C$ 可表示为 $e^A$ 的多项式即可 (注意: Step 1 只是证明了: $C$ 可表示为 $e^C$ 的多项式, 并非 $e^A$ 的多项式). 由于题目的条件和结论在同时相似关系下不改变, 并由 Jordan-Chevalley 定理的证明过程 (参考高代教材的第 324 页), 故不妨设 $A$ 为 Jordan 标准型, $B=\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}$ 为对角阵, $C=\mathrm{diag}\{C_1,C_2,\cdots,C_k\}$ 为分块对角阵, 其中 $\lambda_1,\lambda_2,\cdots,\lambda_n$ 是 $A$ 的全体特征值, $C_i$ 是 $n_i$ 阶幂零阵, $$\mu_1=e^{\lambda_1}=\cdots=e^{\lambda_{n_1}}, \mu_2=e^{\lambda_{n_1+1}}=\cdots=e^{\lambda_{n_1+n_2}}, \cdots, \mu_k=e^{\lambda_{n_1+\cdots+n_{k-1}+1}}=\cdots=e^{\lambda_n},$$ 并且 $\mu_1,\mu_2,\cdots,\mu_k$ 互不相同. 由 $BC=CB$ 可知 $$e^A=e^{B+C}=e^B\cdot e^C=\begin{pmatrix} \mu_1e^{C_1} & & & \\ & \mu_2e^{C_2} & & \\ & & \ddots & \\ & & & \mu_ke^{C_k} \\ \end{pmatrix}.$$ 由 Step 1 可知, $C$ 的每个分块 $C_i$ 都是 $e^{C_i}$ 的多项式, 从而是 $\mu_ie^{C_i}$ 的多项式. 注意到 $e^A$ 的每个分块 $\mu_ie^{C_i}$ 的特征值 $\mu_i$ 互不相同, 故由高代白皮书的例 7.24 (中国剩余定理的应用) 可知, $C$ 是 $e^A$ 的多项式, 从而结论得证.

证法三 (多重插值公式)  令 $f(z)=z-c_1e^z-c_2e^{2z}-\cdots-c_{n-1}e^{(n-1)z}$, 则 $$f'(z)=1-c_1e^z-2c_2e^{2z}-\cdots-(n-1)c_{n-1}e^{(n-1)z}.$$ 令 $g(x)=1-c_1x-2c_2x^2-\cdots-(n-1)c_{n-1}x^{n-1}\in\mathbb{C}[x]$, 则 $f'(z)=g(e^z)$. 本题的结论为: 确定函数 $f(z)$ (即确定常数 $c_1,c_2,\cdots,c_{n-1}$), 使得 $f(A)$ 为可对角化矩阵. 注意到确定函数 $f(z)$ 等价于确定多项式 $g(x)$.

由于题目的条件和结论在相似关系下不改变, 故不妨设 $A=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$ 为 Jordan 标准型, 于是 $f(A)=\mathrm{diag}\{f(J_{r_1}(\lambda_1)),f(J_{r_2}(\lambda_2)),\cdots,f(J_{r_k}(\lambda_k))\}$, 其中 $$f(J_{r_i}(\lambda_i))=\begin{pmatrix} f(\lambda_i) & f'(\lambda_i) & \dfrac{f^{(2)}(\lambda_i)}{2!} & \cdots & \dfrac{f^{(r_i-1)}(\lambda_i)}{(r_i-1)!} \\ & f(\lambda_i) & f'(\lambda_i) & \cdots & \dfrac{f^{(r_i-2)}(\lambda_i)}{(r_i-2)!} \\ & & f(\lambda_i) & \cdots & \dfrac{f^{(r_i-3)}(\lambda_i)}{(r_i-3)!} \\ & & & \ddots & \vdots \\ & & & & f(\lambda_i)\\ \end{pmatrix}.$$ 由 Hermite-Lagrange 多重插值公式 (参考 [3] 的第 12 章或 [4] 的第 1 章), 可取到次数小于等于 $n-1$ 的多项式 $g(x)\in\mathbb{C}[x]$, 使得 $$g(0)=1,\quad g^{(j)}(e^{\lambda_i})=0,\quad 0\leq j\leq r_i-2,\,\,1\leq i\leq k,$$ 由此便确定了函数 $f(z)$. 进一步, 由 $f'(z)=g(e^z)$ 以及求导法则可知 $$f^{(j)}(\lambda_i)=0,\quad 1\leq j\leq r_i-1,\,\,\,\,1\leq i\leq k.$$ 由此即得 $f(J_{r_i}(\lambda_i))=\mathrm{diag}\{f(\lambda_i),f(\lambda_i),\cdots,f(\lambda_i)\}$ 为对角阵, 从而 $f(A)$ 也为对角阵.  $\Box$

我们可得如下两个推论, 其中推论 1 是本题的推广, 推论 2 给出了 $A$ 表示为 $e^A$ 的多项式的充要条件.

推论 1  设 $A$ 为 $n$ 阶复方阵, 则存在次数小于等于 $n-1$ 的复系数多项式 $h(x)$, 使得 $A-h(e^A)$ 是一个可对角化矩阵, 其特征值为 $2k\pi\mathrm{i}\,(k\in\mathbb{Z})$.

证明  由证法一的 Step 3 即得.  $\Box$

推论 2  设 $A$ 为 $n$ 阶复方阵, 则 $A$ 可表示为 $e^A$ 的多项式的充要条件为, 如果 $A$ 有两个特征值等价, 则它们必相等. 特别地, 若 $A$ 的全体特征值的虚部都在 $[0,2\pi)$ 中, 则 $A$ 可表示为 $e^A$ 的多项式.

证明  充分性由推论 1 即得. 至于必要性, 设 $A=h(e^A)$, 其中 $h(x)$ 为复系数多项式, $\lambda,\mu$ 是 $A$ 的两个等价特征值, 则它们也适合方程式 $x=h(e^x)$, 从而 $\lambda=h(e^{\lambda})=h(e^{\mu})=\mu$.  $\Box$

点评  证法一作为 Jordan 标准型的应用, 相对于其他两种证法更易于入手. 虽然证法一篇幅较长, 但证明过程中的分析比较彻底, 由此也得到了更加深刻的结果 (两个推论). 证法二从本质上看应该和证法一是类似的, 比如它们都与 Jordan-Chevalley 分解定理有关联, 在构造多项式表示时都用到了中国剩余定理. 由于证法二是直接引用 Jordan-Chevalley 分解和高代白皮书的例 7.24, 从而证明过程显得更加简洁; 而证法一相当于利用类似的思想去处理新的问题, 所以证明的篇幅较长. 证法三的确十分巧妙, 但从推广的角度来看, 并非是本质的证明. 最后, 在推论 2 中, 若记 $B=e^A$, 则 $A=\mathrm{ln}B$ (取定了对数函数的一个单值分支) 可表示为 $B$ 的多项式, 这也是矩阵函数理论中的一个简单结论 (参考 [4] 的第 1 章).

参考文献

[1]  高代教材: 姚慕生, 吴泉水, 谢启鸿 编著, 高等代数学 (第三版), 复旦大学出版社, 2014.

[2]  高代白皮书: 姚慕生, 谢启鸿 编著, 学习方法指导书: 高等代数 (第三版), 复旦大学出版社, 2015.

[3]  楼红卫 编著, 数学分析 要点 难点 拓展, 高等教育出版社, 2020.

[4]  N. J. Higham, Functions of Matrices, Theory and Computation, SIAM, 2008.

posted @ 2020-02-05 17:01  torsor  阅读(2452)  评论(0编辑  收藏  举报