第八章 复向量空间上的算子
\(\newcommand{\L}{\mathcal L}\newcommand{\M}{\mathcal M}\newcommand{\span}{\operatorname{span}}\newcommand{\null}{\operatorname{null}}\newcommand{\range}{\operatorname{range}}\newcommand{\tr}{\operatorname{tr}}\)
本章假设 \(\mathbb F\) 为 \(\mathbb R\) 或 \(\mathbb C\),且 \(V\) 是有限维的且 \(V\neq\{0\}\),\(n=\dim V\)。
8.1 广义本征向量和幂零算子
-
引理 8.1.1:设 \(T\in\L(V)\),\(k\in\mathbb N\),那么 \(\null T^k\subseteq\null T^{k+1}\),且 \(\null T^k=\null T^{k+1}\implies \null T^{k}=\null T^{k+1}=\null T^{k+2}=\cdots\)。
证明:前者:变为 \(0\) 后再作用 \(T\) 肯定还是 \(0\)。
后者:若 \(u\in \null T^{k+1}\setminus\null T^{k}\),那么一定有 \(Tu\in \null T^k\setminus\null T^{k-1},T^2u\in \null T^{k-1}\setminus\null T^{k-2},\cdots\)。
-
引理 8.1.2:设 \(T\in\L(V)\),\(k\in\mathbb N\),那么 \(\range T^{k}\supseteq\range T^{k+1}\),且 \(\range T^k=\range T^{k+1}\implies \range T^k=\range T^{k+1}=\range T^{k+2}=\cdots\)。
证明:前者:\(\range T^{k+1}\) 是子空间 \(\range T\) 上的 \(\range T^k\),肯定是 \(\range T^{k}\) 的子集。
后者:若 \(T^{k}u\in \range T^k\setminus \range T^{k+1}\),那么 \(T^{k-1}u\in\range T^{k-1}\setminus \range T^k,T^{k-2}u\in\range T^{k-2}\setminus\range T^{k-1},\cdots\)。
另一种看法是,\(\range T^k=\range T^{k+1}\) 说明 \(T\) 在 \(\range T^k\) 上是可逆的,那么再不断作用 \(T\) 得到的 \(\range\) 肯定一直是 \(\range T^{k}\)。
根据 8.1.2,也可以给出 8.1.1 后者的另一种看法:\(\null T^k=\null T^{k+1}\) 说明 \(T\) 在 \(\range T^k\) 上的零空间只有 \(\{0\}\)(否则肯定存在 \(T^ku\neq 0\) 且 \(T^{k+1}u=0\),从而 \(u\in\null T^{k+1}\setminus\null T^k\)),那么 \(T\) 在 \(\range T^k\) 上可逆,那么 \(u\) 作用 \(k'>k\) 次后变为 \(0\) 等价于 \(u\) 作用 \(k\) 次后是 \(0\)。
事实上我们还能得到 \(\Delta_k=\null T^{k+1}-\null T^k\) 的更精确的关系:\(\Delta_k\geq \Delta_{k+1}\)。因为 \(\null T^{k+1}\) 就是 \(\{u\in V:T^ku\in \null T|_{\range T^k}\}\),于是 \(\dim\null T^{k+1}=\dim \null T^k+\dim\null T|_{\range T^k}\),\(\Delta_k=\dim\null T|_{\range T^k}\),从而 \(\Delta_k\) 单调减。
或者从 \(\range\) 的角度理解,直接得到 \(\Delta_k=\range T^k-\range T^{k+1}=\range T^k-\range T|_{\range T^k}=\null T|_{\range T^k}\)。
-
推论 8.1.3:设 \(T\in\L(V)\),\(k\in\mathbb N\),那么 \(\null T^k=\null T^{k+1}\iff \range T^k=\range T^{k+1}\)。
-
引理 8.1.4:设 \(T\in\L(V)\),那么 \(\null T^n=\null T^{n+1}=\cdots\),\(\range T^n=\range T^{n+1}=\cdots\)。
证明:\(\null T^k\) 一直是 \(V\) 的子空间,那么它扩充一次维数就至少增加一,从而至多扩充 \(n\) 次就停止增长。
-
定理 8.1.5:设 \(T\in\L(V)\),\(W\) 是 \(V\) 的子空间。那么 \(V=\null T^n\oplus W\) 且 \(W\) 在 \(T\) 下不变,当且仅当 \(W=\range T^n\)。
证明:先证明 \(V=\null T^n\oplus \range T^n\)。根据维数公式,只需证明 \(\null T^n\oplus \range T^n\) 即可。考虑 \(\range T^n\) 中的任一非零元素 \(T^nu\neq 0\),那么 \(T^{\infty}u\neq 0\),从而 \(T^nu\not\in\null T^n\)。
再证明 \(W\) 的唯一性。由于 \(W\) 在 \(T\) 下不变,所以 \(W\) 在 \(T^n\) 下不变,又因为 \(\null T^n\oplus W\) 进一步可得 \(T^n\) 是 \(W\) 上的双射,从而 \(W=\range T^n|_{W}\) 是 \(\range T^n\) 的子空间,再结合维数即可证明 \(W=\range T^n\)。
考虑 \(v_1,\cdots,v_n\) 是 \(V\) 的一组基,\(Tv_1=0,Tv_2=v_1,\cdots,Tv_n=v_{n-1}\)。那么 \(\null T^k=\span\{v_1,\cdots,v_k\}\),\(\range T^k=\span\{v_1,\cdots,v_{n-k}\}\)。从而合法的 \(V=\null T^m\oplus\range T^m\) 只有 \(m=0\) 或 \(m=n\),而 \(m=0\) 时表现为 \(V=\null I\oplus\range I\) 是极其平凡的。
- 定义 8.1.6(广义本征向量):设 \(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值,\(v\in V\)。称 \(v\) 为 \(T\) 相应于 \(\lambda\) 的广义本征向量,当且仅当 \(v\neq 0\) 且存在正整数 \(j\) 使得 \((T-\lambda I)^jv=0\)。
显然若 \((T-\lambda I)^j\) 不可逆,那么 \(T-\lambda I\) 不可逆,从而 \(\lambda\) 是 \(T\) 的本征值。
- 引理 8.1.7:设 \(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值,\(v\in V\)。那么 \(v\) 为 \(T\) 相应于 \(\lambda\) 的广义本征向量,当且仅当 \(v\neq 0\) 且 \((T-\lambda I)^{n}v=0\)。
- 定义 8.1.8(广义本征空间):设 \(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值。定义 \(T\) 相应于 \(\lambda\) 的广义本征空间为 \(G(\lambda,T):=\null (T-\lambda I)^n\)。
\(G(\lambda,T)\) 即为所有 \(T\) 相应于 \(\lambda\) 的广义本征向量并上 \(\{0\}\) 构成的子空间。
-
引理 8.1.9(不同本征值对应的广义本征向量线性无关):设 \(T\in\mathcal L(V)\),\(\lambda_1,\cdots,\lambda_m\) 是 \(T\) 的互不相同的本征值,\(v_1,\cdots,v_m\) 是相应的广义本征向量。则 \(v_1,\cdots,v_m\) 线性无关。
证明:设 \(j_i\) 使得 \((T-\lambda_i I)^{j_i}v_i=0\) 且 \(j_i\) 最小,那么 \(j_i>0\)。假设 \(v_1,\cdots,v_m\) 线性相关,那么存在不全为零的 \(c_1,\cdots,c_m\in\mathbb F\) 使得 \(c_1v_1+\cdots+c_mv_m=0\)。不妨设 \(c_1\neq 0\),那么 \(v_1=c_2'v_2+\cdots+c_m'v_m\)。
设 \(w:=(T-\lambda_1 I)^{j_1-1}v_1\),那么 \(w\neq 0\) 且 \(Tw=\lambda_1w\)。将 \((T-\lambda_1I)^{j_1-1}(T-\lambda_2I)^{j_2}\cdots(T-\lambda_m I)^{j_m}\) 作用到 \(v_1=c_2'v_2+\cdots+c_m'v_m\) 两端,得到 \((T-\lambda_2I)^{j_2}\cdots(T-\lambda_mI)^{j_m}w=0\),由于 \(T^kw=\lambda_1^k w\),所以可以证明上式可以改写为 \((\lambda_1-\lambda_2I)^{j_2}\cdots(\lambda_1-\lambda_mI)^{j_m}w=0\),那么 \(w=0\) 矛盾。
-
定义 8.1.10(幂零算子):设 \(T\in\L(V)\),称 \(T\) 是幂零的,当且仅当存在 \(k\in\mathbb N\) 使得 \(T^k=0\)。
显然 \(T\) 是幂零的当且仅当 \(\null T^n=V\) 即 \(T^n=0\)。
-
定理 8.1.11:设 \(N\in\L(V)\) 是幂零算子。那么 \(N\) 关于 \(V\) 的某个基有对角线为 \(0\) 的上三角矩阵。
证明:由于 \(\null N^n=V\),所以容易得到一组 \(V\) 的基 \(v_1,\cdots,v_n\) 使得对每个 \(i\),\(v_1,\cdots,v_{\dim \null N^{i}}\) 恰好张成 \(\null N^i\)。然后容易证明 \(Nv_i\in\span\{v_1,\cdots,v_{i-1}\}\)。
这里的构造导致的含义是,将 \(N\) 作用在一个向量上看作舍弃其最高维坐标。
8.2 算子的分解
-
引理 8.2.1:设 \(T\in\L(V)\),\(p,q\in \mathcal P(\mathbb F)\),那么 \(\null p(T)\) 和 \(\range p(T)\) 在 \(q(T)\) 下不变。
证明:\(\null p(T)\) 在 \(q(T)\) 下不变:即证 \(p(T)u=0\implies p(T)(q(T)u)=0\)。
\(\range p(T)\) 在 \(q(T)\) 下不变:即证 \(q(T)(p(T)u)\in\range p(T)\)。
结合定理 8.1.5 和引理 8.2.1,对任意 \(p(T)\),可以将 \(V\) 拆成两个子空间 \(\null p(T)^n\) 和 \(\range p(T)^n\) 的直和,且这两个子空间在 \(q(T)\) 下都是不变的(甚至当 \(q(T)=T\) 时,可以类似定理 8.1.5 一样证明,满足此性质的 \(V\) 的子空间只有 \(\range p(T)^n\);注意此事当 \(q(T)\) 任意时不一定成立,例如 \(q(T)=I\) 时,“在 \(q(T)\) 下不变” 是恒成立的) 。这为我们做广义本征空间分解提供了基础。
-
定理 8.2.2(广义本征空间分解):设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),互不相同的 \(\lambda_1,\cdots,\lambda_m\) 是 \(T\) 的所有本征值。那么:
- \(V=G(\lambda_1,T)\oplus\cdots\oplus G(\lambda_m,T)\)。
- \(G(\lambda_i,T)\) 在 \(T\) 下不变。
- \((T-\lambda_i I)|_{G(\lambda_i,T)}\) 是幂零的。
证明:3 直接由 \(G(\lambda_i,T)=\null (T-\lambda_iI)^n\) 的定义导出。2 是引理 8.2.1 的推论。
1:我们知道有限维复空间上的算子总有本征值,那么任取一个本征值 \(\lambda_1\),那么 \(\dim G(\lambda_1,T)=\dim\null (T-\lambda_1I)^n>0\)。根据定理 8.1.5,我们知道 \(V=\null (T-\lambda_1I)^n\oplus \range(T-\lambda_1I)^n\),而且根据引理 8.2.1 可知 \(\range(T-\lambda_1I)^n\) 在 \(T\) 下不变(这个条件的缺失导致有限维复空间不一定能狭义本征空间分解),那么我们对 \(\range(T-\lambda_1I)^n\) 递归进行此操作即可。
-
引理 8.2.3:设 \(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值,那么存在唯一的 \(V\) 的子空间 \(W\),使得 \(V=G(\lambda,T)\oplus W\) 且 \(W\) 在 \(T\) 下不变。
证明:由于 \(W\) 在 \(T\) 下不变,所以容易看出 \(W\) 在 \((T-\lambda I)^n\) 下也是不变的,从而 \(W\) 是 \(\range(T-\lambda I)^n\) 的子空间,
-
推论 8.2.3:设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),则 \(V\) 有一组由 \(T\) 的广义本征向量组成的基。
-
定义 8.2.4(重数):设 \(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值,定义 \(\lambda\) 的重数为 \(\dim G(\lambda,T)=\dim\null (T-\lambda I)^n\)。
设 \(d\) 是 \(\lambda\) 的重数,那么容易看出,\(\null(T-\lambda I)^n=\null (T-\lambda I)^d\)。
-
推论 8.2.5:设 \(T\in\L(V)\)。那么 \(T\) 的所有本征值的重数之和为 \(n\)。
-
定义 8.2.6(分块对角矩阵):略。
-
定理 8.2.7:设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),互不相同的 \(\lambda_1,\cdots,\lambda_m\) 是 \(T\) 的所有本征值,重数分别为 \(d_1,\cdots,d_m\)。则 \(T\) 关于 \(V\) 的某个基有分块对角矩阵,其中对角线上的子矩阵分别为 \(A_1,\cdots,A_m\),满足 \(A_i\) 是 \(T\) 关于 \(G(\lambda_i,T)\) 的某个基的上三角矩阵,且 \(A_i\) 对角线上的元素均为 \(\lambda_i\)。
证明:\(T-\lambda_iI\) 是 \(G(\lambda_i,T)\) 上的算子且是幂零的,所以根据定理 8.1.11,存在 \(G(\lambda_i,T)\) 的一组基,使得 \(T-\lambda_iI\) 在 \(G(\lambda_i,T)\) 上关于这组基有对角线为 \(0\) 的上三角矩阵 \(A_i'\)。那么 \(T\) 在 \(G(\lambda_i,T)\) 上关于这组基的矩阵为 \(A_i'+\lambda_iI\) 是对角线元素均为 \(\lambda_i\) 的上三角矩阵。
定理 8.2.7 的证明过程实际上在表示,能在 \(\null (T-\lambda_iI)^n\) 上选出一组基 \(v_1,\cdots,v_m\),使得 \((T-\lambda_iI)v_j\in\span\{v_1,\cdots,v_{j-1}\}\) 总成立,也即将一个向量 \(u\) 作用上 \(T\) 再减去 \(\lambda_i\) 倍的自己,总能消掉自己的最高维坐标。由此也可以看出,\(Tv_j\) 总是 \(\lambda v_j+\span\{v_1,\cdots,v_{j-1}\}\) 的形式。而之所以能出现这样的效果,源自于我们对 \(\null (T-\lambda_iI),\null(T-\lambda_iI)^2,\null (T-\lambda_iI)^3,\cdots\) 结构的分析。
下面是广义本征空间分解的一个应用。
-
引理 8.2.8:设 \(N\in\L(V)\) 是幂零算子,\(p\in\mathcal P(\mathbb F)\) 是常数项为 \(1\) 的多项式,那么 \(p(N)\) 有平方根。
证明:注意到 \(N^n=0\),于是在模 \(z^{n}\) 意义下将 \(p\) 解出来一个平方根即可。
-
定理 8.2.9:设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\) 是可逆的,那么 \(T\) 有平方根。
证明:设非零的 \(\lambda_1,\cdots,\lambda_m\) 是 \(T\) 的互不相同的本征值。对每个 \(i\),存在 \(G(\lambda_i,T)\) 上的幂零算子使得 \(T|_{G(\lambda_i,T)}=\lambda_iI+N_i\),从而 \(T|_{G(\lambda_i,T)}\) 存在平方根 \(R_i\)(注意任意复数都存在平方根)。然后构造 \(R\) 使得 \(R\) 在每个 \(G(\lambda_i,T)\) 上的表现都和 \(R_i\) 相同即可得到 \(T\) 的平方根。
事实上,用类似的方法,可以将定理 8.2.9 扩展到任意 \(k\) 次根。
8.3 特征多项式与极小多项式
-
定义 8.3.1(特征多项式):设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),互不相同的 \(\lambda_1,\cdots,\lambda_m\) 是 \(T\) 的所有本征值,重数分别为 \(d_1,\cdots,d_m\)。定义 \(T\) 的特征多项式为 \((z-\lambda_1)^{d_1}(z-\lambda_2)^{d_2}\cdots(z-\lambda_m)^{d_m}\)。
-
定理 8.3.2(凯莱-哈密尔顿定理):设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),\(q\) 是 \(T\) 的特征多项式,则 \(q(T)=0\)。
证明:\(V\) 有一组由 \(T\) 的广义本征向量构成的基,而 \((T-\lambda_1I)^{d_1}\cdots(T-\lambda_mI)^{d_m}\) 作用在这组基的任意一个元素上都得到 \(0\)(根据多项式变换的可交换性)。
-
定义 8.3.3(极小多项式):设 \(\mathbb F\) 是任意域,\(T\in\L(V)\)。则存在唯一的多项式 \(p\) 使得 \(p\) 是使得 \(p(T)=0\) 的次数最小的首一多项式。由此,将其定义为 \(T\) 的极小多项式。
证明:唯一性:若不同 \(p,q\) 都满足条件,那么 \(p-q\neq 0\) 也满足条件且次数更小,矛盾。
存在性:根据引理 3.4.5 可知 \(\L(V)\) 是维数为 \(n^2\) 的线性空间。那么 \(I,T,T^2,\cdots,T^{n^2}\) 必然线性相关。
-
定理 8.3.4:设 \(\mathbb F\) 是任意域,\(T\in\L(V)\),\(q\in\mathcal P(\mathbb F)\)。那么 \(q(T)=0\) 当且仅当 \(q\) 是 \(p\) 的多项式倍。
证明:设 \(r=q\bmod{}p\),那么 \(r(T)=0\) 且 \(r\) 的次数小于 \(p\),从而必然有 \(r=0\)。
作为定理 8.3.4 的推论,有限维复空间上算子的特征多项式是该算子的极小多项式的多项式倍。但实际上,特征多项式和极小多项式的根都是一样的,只有重数上的不同。
-
引理 8.3.5:设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),\(\lambda\) 是 \(T\) 的本征值,\(p\) 是 \(T\) 的极小多项式。那么 \(p(\lambda)=0\)。
证明:存在 \(v\in V\land v\neq 0\) 满足 \(Tv=\lambda v\),那么 \(p(T)v=0\) 说明 \(p(\lambda)v=0\),从而 \(p(\lambda)=0\)。
接下来的内容是极小多项式在其他章节的应用。
-
引理 8.3.6:设 \(\mathbb F\) 是任意域,\(T\in\L(V)\)。那么 \(T\) 关于 \(V\) 的某组基有上三角矩阵当且仅当存在 \(m\in\mathbb N\) 和 \(\lambda_1,\cdots,\lambda_m\in \mathbb F\) 使得 \((z-\lambda_1)\cdots(z-\lambda_m)\) 是 \(T\) 的极小多项式。
证明:=>:直接将矩阵对角线上的元素作为 \(\lambda_1,\cdots,\lambda_n\) 即可得到 \(T\) 的一个零化多项式,因为基中的第 \(i\) 个元素作用 \((T-\lambda_1 I)\cdots(T-\lambda_i I)\) 会变为 \(0\)。再结合定理 8.3.4 即证。
<=:归纳法。由于 \((T-\lambda_1 I)\cdots(T-\lambda_m I)=0\),那么任选 \(v\in V\land v\neq 0\),找到最大的 \(1\leq i\leq m\) 使得 \((T-\lambda_i I)\cdots(T-\lambda_m I)v=0\) 且 \((T-\lambda_{i+1} I)\cdots(T-\lambda_m I) v\neq 0\),此时 \(w=(T-\lambda_{i+1} I)\cdots(T-\lambda_m I) v\) 就是 \(T\) 关于本征值 \(\lambda_i\) 的本征向量。令 \(W=\operatorname{span}\{w\}\),那么仍然有 \((T/W-\lambda_1 I/W)\cdots(T/W-\lambda_m I/W)=0/W\),再根据定理 8.3.4,可知 \(V/W\) 的极小多项式依然满足归纳假设。
类似舒尔定理,我们可以将引理 8.3.6 中的基要求为标准正交的。
-
引理 8.3.7:设 \(\mathbb F\) 是任意域,\(T\in\L(V)\)。那么 \(T\) 可对角化当且仅当存在 \(m\in\mathbb N\) 和互不相同的 \(\lambda_1,\cdots,\lambda_m\in \mathbb F\) 使得 \((z-\lambda_1)\cdots(z-\lambda_m)\) 是 \(T\) 的极小多项式。
证明:=>:类似引理 8.3.6。
<=:归纳法。首先根据引理 8.2.1,可知 \(\range(T-\lambda_m I)\) 在 \((T-\lambda_1 I)\cdots(T-\lambda_{m-1} I)\) 下不变,从而 \((z-\lambda_1)\cdots(z-\lambda_{m-1})\) 是 \(\range(T-\lambda_mI)\) 的零化多项式,那么根据归纳,\(\range(T-\lambda_mI)\) 存在本征空间分解。而 \(\range(T-\lambda_mI)\subseteq\null(T-\lambda_1 I)\cdots(T-\lambda_{m-1} I)\),\(\null(T-\lambda_1 I)\cdots(T-\lambda_{m-1} I)\oplus \null(T-\lambda_mI)\),\(\dim\range(T-\lambda_mI)+\dim\null(T-\lambda_mI)=n\),可知 \(\range(T-\lambda_mI)\oplus\null(T-\lambda_mI)\),从而 \(V\) 存在本征空间分解。
-
引理 8.3.8(实谱定理):设 \(\mathbb F=\mathbb R\),\(V\) 是有限维内积空间,\(T\in\L(V)\) 是自伴的,那么 \(T\) 关于 \(V\) 的某组标准正交基有对角矩阵。
证明:将 \(T\) 的极小多项式在 \(\mathbb R\) 上因式分解成若干一次式和二次式的乘积,根据引理 7.2.2 可知其中肯定不含二次式,否则与极小性矛盾。那么根据引理 8.3.6,\(T\) 关于 \(V\) 的某组标准正交基有上三角矩阵,而 \(T\) 是自伴的、\(\mathbb F=\mathbb R\),可知 \(T\) 关于这组基应该是对角矩阵。
8.4 若尔当形
-
引理 8.4.1:设 \(N\in\L(V)\) 是幂零算子。则存在 \(v_1,\cdots,v_m\in V\) 和 \(j_1,\cdots,j_m\in\mathbb N\) 使得:
- \(N^{j_1}v_1,\cdots,Nv_1,v_1,\cdots,N^{j_m}v_m,\cdots,Nv_m,v_m\) 是 \(V\) 的基。
- \(N^{j_i+1}v_i=0\) 对任意 \(i\) 成立。
证明:归纳地假设现在已经选出了 \(U=\{v_1,Nv_1,\cdots,N^{j_1}v_1,\cdots,v_k,Nv_k,\cdots,N^{j_k}v_k\}\)。我们对每个 \(u\in U\) 指定 \(d_u\) 满足 \(N^{d_u}u=0\) 且 \(N^{d_u-1}u\neq 0\)。设 \(U_d=\{u\in U:d_u=d\}\)。归纳地假设对任意 \(i\geq 1\) 有 \(\dim\null N^{i+1}-\dim\null N^i-|U_{i+1}|\leq \dim\null N^i-\dim\null N^{i-1}-|U_i|\) 且 \((\span{U_i})\oplus\null N^{i-1}\)。
假如 \(|U|\) 的维数还不够 \(\dim V\),那么可以选出最大的 \(i\) 使得 \(\dim\null N^i-\dim \null N^{i-1}-|U_i|>0\)。此时从 \(\null N^i\setminus ((\span U_i)\oplus \null N^{i-1})\) 中选出一个 \(v_{k+1}\)。考虑把 \(v_{k+1},Nv_{k+1},\cdots,N^i v_{k+1}\) 加入 \(U\) 中。现在来证明 \(N^av_{k+1}\) 与 \((\span U_{i-a}\oplus \null N^{i-a-1})\) 线性无关:不妨设 \(U_{i}=\{N^{a_1}v_1,\cdots,N^{a_k}v_k\}\),那么 \(U_{i-a}=\{N^{a_1+a}v_1,\cdots,N^{a_k+a}v_k\}\)。假设存在 \(c_1,\cdots,c_k\in\mathbb F\) 和 \(w\in \null N^{i-a-1}\) 使得 \(N^av_{k+1}=c_1N^{a_1+a}v_1+\cdots+c_kN^{a_k+a}v_k+w\)。两侧同时作用 \(N^{i-a-1}\),得到 \(N^{i-1}v_{k+1}=c_1N^{a_1+i-1}v_1+\cdots+c_kN^{a_k+i-1}v_k\),那么 \(N^{i-1}(v_{k+1}-c_1N^{a_1}v_1-\cdots-c_kN^{a_k}v_k)=0\),这与 \(v_{k+1}-c_1N^{a_1}v_1-\cdots-c_kN^{a_k}v_k\in \null N^i\setminus \null N^{i-1}\) 矛盾。
-
定义 8.4.2(若尔当基):设 \(T\in\L(V)\)。称 \(V\) 的一组基为 \(T\) 的若尔当基,当且仅当 \(T\) 关于这组基有分块对角矩阵,其中对角线上的子矩阵分别为 \(A_1,\cdots,A_m\),满足 \(A_i\) 的对角线元素均为 \(T\) 的某个特征值 \(\lambda_i\),\(A_i\) 中紧位于对角线上方的元素均为 \(1\),\(A_i\) 中其他元素均为 \(0\)。
-
定理 8.4.3(若尔当形):设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\),则 \(V\) 有一组 \(T\) 的若尔当基。
证明:对 \(T\) 的每个特征值 \(\lambda\),根据引理 8.4.1,对于 \(G(\lambda,T)\) 上的幂零算子 \(T-\lambda I\) 能找到 \(v_1,\cdots,v_m\in G(\lambda,T)\) 和 \(j_1,\cdots,j_m\in\mathbb N\)。将所有这样的 \((\lambda,v,j)\) 取出,记为 \((\lambda_1,v_1,j_1),\cdots,(\lambda_s,v_s,j_s)\)。那么 \((T-\lambda_1I)^{j_1}v_1,\cdots,(T-\lambda_1I)v_1,v_1,\cdots,(T-\lambda_sI)^{j_s}v_s,\cdots,(T-\lambda_sI)v_s,v_s\) 是 \(V\) 的基。
同时,对每个 \((\lambda,v,j)\) 和 \(0\leq k\leq j\),可知 \(T(T-\lambda I)^kv=(T-\lambda I)^{k+1}v+\lambda(T-\lambda I)^kv\),即可得证。
8.5 迹
由于历史编排原因,请先阅读 9.1 再来阅读这一节。
-
定义 8.5.1(单位矩阵):略。
-
定义 8.5.2(矩阵的逆):略。
-
定义 8.5.3(算子的迹):设 \(T\in\L(V)\)。若 \(V\) 是 \(\mathbb C\) 上的,则定义 \(T\) 的迹 \(\tr(T)\)为 \(T\) 的按重数重复的全体本征值之和;若 \(V\) 是 \(\mathbb R\) 上的,则定义 \(T\) 的迹等于 \(T_\C\) 的迹。
-
定义 8.5.4(矩阵的迹):略。
-
引理 8.5.5:设 \(A,B\) 是大小相同的方阵,那么 \(\tr(AB)=\tr(BA)\)。
-
引理 8.5.6:设 \(T\in\L(V)\),\(u_1,\cdots,u_n\) 和 \(v_1,\cdots,v_n\) 是 \(V\) 的基,则 \(\tr\M(T,(u_1,\cdots,u_n))=\tr\M(T,(v_1,\cdots,v_n))\)。
证明:结合 \(\M(T,(u_1,\cdots,u_n))=\M(I,(v_1,\cdots,v_n),(u_1,\cdots,u_n))\ \M(T,(v_1,\cdots,v_n))\ \M(I,(u_1,\cdots,u_n),(v_1,\cdots,v_n))\)、\(\M(S,(u_1,\cdots,u_n),(v_1,\cdots,v_n))^{-1}=\M(S^{-1},(v_1,\cdots,v_n),(u_1,\cdots,u_n))\)、引理 8.5.5 可知。
-
定理 8.5.7:设 \(T\in\L(V)\),那么 \(\tr T=\tr\M(T)\)。
证明:利用定理 8.2.7。
-
推论 8.5.8:设 \(S,T\in\L(V)\),那么 \(\tr(S+T)=\tr S+\tr T\),\(\tr(ST)=\tr(TS)\)。