第五章 本征值、本征向量、不变子空间

5.1 不变子空间

  • 定义 5.1.1(不变子空间):设 \(T\in\mathcal L(V)\)。称 \(V\) 的子空间 \(U\)\(T\) 下不变,当且仅当对于任意 \(u\in U\)\(Tu\in U\)

平凡的不变子空间有 \(\{0\},V,\operatorname{null} T,\operatorname{range} T\)

  • 定义 5.1.2(本征值):设 \(T\in\mathcal L(V)\)\(\lambda \in \mathbb F\)。称 \(\lambda\)\(T\) 的本征值,当且仅当存在 \(v\in V\)\(v\neq 0\) 使得 \(Tv=\lambda v\)

  • 引理 5.1.3:设 \(V\) 是有限维的,\(T\in \mathcal L(V)\)\(\lambda \in\mathbb F\)。那么下列命题等价:

    1. \(\lambda\)\(T\) 的本征值。
    2. \(T-\lambda I\) 不是单射。
    3. \(T-\lambda I\) 不是满射。
    4. \(T-\lambda I\) 不是可逆的。

    证明:1 说明 \(v\in V\)\(v\neq 0\) 使得 \((T-\lambda I)v=0\) 从而 \(T-\lambda I\) 不是单射。2 说明 \(\dim\operatorname{range}(T-\lambda I)<\dim V\) 从而 \(\dim\operatorname{null}(T-\lambda I)>0\)

  • 定义 5.1.4(本征向量):设 \(T\in\mathcal L(V)\)\(\lambda\)\(T\) 的本征值,\(v\in V\)。称 \(v\)\(T\) 的相应于 \(\lambda\) 的本征向量,当且仅当 \(v\neq 0\)\(Tv=\lambda v\)

\(v\neq 0\)\(T\) 相应于 \(\lambda\) 的本征向量,当且仅当 \(v\in\operatorname{null}(T-\lambda I)\)

  • 引理 5.1.5(不同本征值对应的本征向量线性无关):设 \(T\in\mathcal L(V)\)\(\lambda_1,\cdots,\lambda_m\)\(T\) 的互不相同的本征值,\(v_1,\cdots,v_m\) 是相应的本征向量。则 \(v_1,\cdots,v_m\) 线性无关。

    证明:反证,若 \(v_1,\cdots,v_m\) 线性相关,则存在最小的 \(k\),使得 \(v_k\in\operatorname{span}(v_1,\cdots,v_{k-1})\)

    那么存在非全零的 \(c_1,\cdots,c_{k-1}\in\mathbb F\) 满足 \(v_k=\sum_{i=1}^{k-1}c_iv_i\)。将等式两边同时乘上 \(\lambda_k\)、或同时作用 \(T\),分别得到 \(\lambda_kv_k=\sum_{i=1}^{k-1}c_i\lambda_kv_i\)\(\lambda_kv_k=\sum_{i=1}^{k-1}c_i\lambda_iv_i\)。两式相减得到 \(\sum_{i=1}^{k-1}c_i(\lambda_k-\lambda_i)v_i=0\)。由于 \(\lambda_1,\cdots,\lambda_k\) 两两不同,且存在 \(c_i\) 非零,所以必然存在 \(c_i(\lambda_k-\lambda_i)\) 非零,那么 \(v_1,\cdots,v_{k-1}\) 就应线性相关,与 \(k\) 是最小的矛盾。

  • 引理 5.1.6:设 \(V\) 是有限维的,\(T\in\mathcal L(V)\)。则 \(T\) 至多有 \(\dim V\) 个互不相同的本征值。

  • 定义 5.1.7(限制算子、商算子):设 \(T\in\mathcal L(V)\)\(U\)\(V\) 的在 \(T\) 下不变的子空间。

    定义限制算子 \(T|_U\in\mathcal L(U)\)\(T|_U(u):=Tu\)

    定义商算子 \(T/U\in\mathcal L(V/U)\)\((T/U)(v+U):=Tv+U\)

    证明:对于 \(T|_U\),容易证明它确实是 \(U\) 上的算子。对于 \(T/U\),它显然是 \(V/U\) 上的算子。

    对于 \(T/U\),要证明它是良定义的,即对于任意 \(v+U=w+U\),有 \(Tv+U=Tw+U\)。这是因为 \(v+U=w+U\implies v-w\in U\implies T(v-w)\in U\implies Tv-Tw\in U\implies Tv+U=Tw+U\)

5.2 本征向量和上三角矩阵

容易定义算子 \(T\in \mathcal L(V)\) 的非负整数次幂。当 \(T\) 可逆时,幂次还能是负整数。算子的幂显然仍然是算子。

  • 定义 5.2.1:设 \(T\in\mathcal L(V)\)\(p\in\mathcal P(\mathbb F)\) 满足对于任意 \(z\in\mathbb F\)\(p(z)=\sum_{i=0}^ma_iz^i\)。那么定义 \(p\in \mathcal L(V)\)\(p(T):=\sum_{i=0}^ma_iT^i\)

为了方便,现在 \(p\) 有两层含义,其一是 \(\mathcal P(\mathbb F)\) 中的元素,其二是 \(\mathcal L(V)\) 中的元素。实际上的操作是在二者之间建立了一个映射,而且容易看出这个映射是线性的。

  • 引理 5.2.2:设 \(T\in\mathcal L(V)\)\(p,q\in\mathcal P(\mathbb F)\)。那么:

    1. \((pq)(T)=p(T)q(T)\)
    2. \(p(T)q(T)=q(T)p(T)\)

    证明:按定义展开即可。

那么,我们对多项式进行的许多操作(包括因式分解等),也能把其中的 \(z\) 换成 \(T\) 进行。

  • 引理 5.2.3:设 \(V\)\(\mathbb C\) 上的 \(n(n>0)\) 维向量空间,\(T\in \mathcal L(V)\)。那么 \(T\) 有本征值。

    证明:任取 \(v\in V\)\(v\neq 0\)。由于 \(n+1\) 个向量 \(v,Tv,\cdots,T^nv\) 线性相关,于是存在非全零的 \(a_0,\cdots,a_n\in\mathbb C\) 使得 \(\sum_{i=0}^na_iT^iv=0\)。进一步地可知 \(a_1,\cdots,a_n\) 非全零,否则有 \(a_0v=0\) 那么 \(a_0\) 就也为零了。

    那么根据代数基本定理,存在 \(m\geq 1\)\(c,\lambda_1,\cdots,\lambda_m\in\mathbb C\)\(c\neq 0\) 使得 \(\sum_{i=0}^na_iz^i=c\prod_{i=1}^m(z-\lambda_i)\) 对所有 \(z\in\mathbb C\) 均成立。则 \(0=\sum_{i=0}^na_iT^iv=(\sum_{i=0}^na_iT^i)v=(c\prod_{i=1}^m(T-\lambda_iI))v\)。那么 \(c\prod_{i=1}^m(T-\lambda_iI)\) 不是单射,从而必然存在某 \(T-\lambda_i I\) 不是单射,即 \(\lambda_i\) 是本征值。

    证明的关键在于找到 \(p\in\mathcal P(\mathbb C),p\neq 0\)\(v\in V,v\neq 0\) 使得 \((p(T))v=0\)。所以一些其他构造方式,例如:同样任取一个 \(v\in V,v\neq 0\),然后考虑由 \(\phi(p):=(p(T))v\) 定义的函数 \(\phi:\mathcal P_n(\mathbb C)\to V\),容易验证 \(\phi\) 是线性映射,由于 \(\dim \mathcal P_n(\mathbb C)=n+1\)\(\dim V=n\),所以得到 \(\dim \operatorname{null}\phi>0\),所以存在 \(p\neq 0\) 使得 \((p(T))v=0\)

  • 定义 5.2.4(算子的矩阵):设 \(T\in\mathcal L(V)\)\(v_1,\cdots,v_n\)\(V\) 的基。定义 \(T\) 关于这组基的矩阵为 \(n\times n\) 的矩阵 \(\mathcal M(T)\) 满足 \(Tv_i=\sum_{j=1}^n\mathcal M(T)_{j,i}v_j\)

    如果基在上下文中不是自明的,则使用记号 \(\mathcal M(T,(v_1,\cdots,v_n))\)

  • 引理 5.2.5:设 \(T\in\mathcal L(V)\)\(v_1,\cdots,v_n\)\(V\) 的基,那么下列命题等价:

    1. \(\mathcal M(T,(v_1,\cdots,v_n))\) 是上三角矩阵。
    2. 对于任意 \(j\)\(Tv_j\in\operatorname{span}(v_1,\cdots,v_j)\)
    3. 对于任意 \(j\)\(\operatorname{span}(v_1,\cdots,v_j)\)\(T\) 下不变。

\(\mathcal M(T,(v_1,\cdots,v_n))\) 是上三角矩阵,那么有 \(Tv_1=\mathcal M(T)_{1,1}v_1\),从而 \(\mathcal M(T)_{1,1}\)\(T\) 的本征值,\(v_1\) 是其对应的本征向量。

  • 引理 5.2.6:设 \(V\)\(\mathbb C\) 上的 \(n(n>0)\) 维向量空间,\(T\in \mathcal L(V)\)。那么 \(T\) 关于 \(V\) 的某个基有上三角矩阵。

    证明:只需构造线性无关的 \(v_1,\cdots,v_n\) 满足对于任意 \(j\)\(Tv_j\in\operatorname{span}(v_1,\cdots,v_j)\) 即可。考虑逐个构造。

    假设已经构造好了 \(v_1,\cdots,v_{j}\)\(0\leq j<n\)),记 \(U=\operatorname{span}(v_1,\cdots,v_j)\)。考虑商算子 \(T/U\in \mathcal L(V/U)\),由于 \(V/U\)\(\mathbb C\) 上的 \(n-j>0\) 维向量空间,所以根据引理 5.2.3,\(T/U\) 存在本征值 \(\lambda\),那么也就存在 \(w\in V\) 使得 \(Tw+U=(T/U)(w+U)=\lambda(w+U)=\lambda w+U\)\(w+U\neq U\)(那么 \(w\not\in U\)\(w\not\in\operatorname{span}(v_1,\cdots,v_j)\)),那么有 \(Tw-\lambda w\in U\),于是 \(Tw\in\operatorname{span}(v_1,\cdots,v_{j},w)\)。取 \(v_{j+1}:=w\) 即可。

  • 引理 5.2.7:设 \(T\in\mathcal L(V)\)\(T\) 关于 \(V\) 的基 \(v_1,\cdots,v_n\) 有上三角矩阵。那么 \(T\) 可逆当且仅当 \(\mathcal M(T,(v_1,\cdots,v_n))\) 对角线上的元素全部非零。

    证明:若 \(T\) 可逆,但 \(\mathcal M(T)\) 对角线上存在零,那么存在最小的 \(j\) 使得 \(\mathcal M(T)_{j,j}=0\)。记 \(U=\operatorname{span}(v_1,\cdots,v_{j-1})\),那么 \(T v_j\in U\)。可知 \(T|_U\in\mathcal L(U)\)\(\mathcal M(T)_{[1,j-1],[1,j-1]}\)\(T|_U\) 关于 \(U\) 的基 \(v_1,\cdots,v_{j-1}\) 的上三角矩阵,根据归纳可知 \(T|_U\) 是可逆的,那么存在 \(u\in U\) 使得 \(Tu=Tv_j\),从而 \(T\) 不是单射,矛盾。

    \(T\) 不可逆,那么 \(Tv_1,\cdots,Tv_n\) 线性相关,那么存在最小的 \(j\) 使得 \(Tv_j\in\operatorname{span}(Tv_1,\cdots,Tv_{j-1})\),由于 \(\operatorname{span}(v_1,\cdots,v_{j-1})\)\(T\) 下不变,所以 \(\operatorname{span}(Tv_1,\cdots,Tv_{j-1})\subseteq \operatorname{span}(v_1,\cdots,v_{j-1})\),从而 \(\mathcal M(T)_{j,j}=0\)

  • 引理 5.2.8:设 \(T\in\mathcal L(V)\)\(T\) 关于 \(V\) 的基 \(v_1,\cdots,v_n\) 有上三角矩阵。那么 \(\mathcal M(T,(v_1,\cdots,v_n))\) 对角线上的元素构成了所有 \(T\) 的本征值。

    证明:由于 \(\mathcal M(T-\lambda I)\) 也是上三角矩阵,所以 \(T-\lambda I\) 不可逆当且仅当 \(\mathcal M(T-\lambda I)\) 对角线上存在零,也就是 \(\lambda\)\(\mathcal M(T)\) 对角线上出现。

5.3 本征空间和对角矩阵

  • 定义 5.3.1(本征空间):设 \(T\in\mathcal L(V)\)\(\lambda\in\mathbb F\)。定义 \(T\) 相应于 \(\lambda\) 的本征空间为 \(E(\lambda,T):=\operatorname{null}(T-\lambda I)\)

\(E(\lambda,T)\) 即为所有 \(T\) 相应于 \(\lambda\) 的本征向量并上 \(\{0\}\) 构成的子空间。

  • 引理 5.3.2:设 \(V\) 是有限维的,\(T\in\mathcal L(V)\)\(\lambda_1,\cdots,\lambda_m\)\(T\) 的互不相同的本征值。那么 \(E(\lambda_1,T)+\cdots+E(\lambda_m,T)\) 是直和。

  • 定义 5.3.3(可对角化):设 \(T\in\mathcal L(V)\)。称 \(T\) 是可对角化的,当且仅当 \(T\) 关于 \(V\) 的某个基有对角矩阵。

  • 引理 5.3.4:设 \(V\) 是有限维的,\(T\in\mathcal L(V)\)\(\lambda_1,\cdots,\lambda_m\)\(T\) 的所有互不相同的本征值(\(m\leq n\))。那么下列命题等价:

    1. \(T\) 可对角化。
    2. \(V\) 有由 \(T\) 的本征向量构成的基。
    3. \(V\) 有在 \(T\) 下不变的一维子空间 \(U_1,\cdots,U_n\) 使得 \(V=U_1\oplus\cdots\oplus U_n\)
    4. \(V=E(\lambda_1,T)\oplus \cdots\oplus E(\lambda_m,T)\)
    5. \(\dim V=\dim E(\lambda_1,T)+\cdots+\dim E(\lambda_m,T)\)
  • 引理 5.3.5:设 \(V\) 是有限维的,\(T\in\mathcal L(V)\)\(T\)\(n\) 个互不相同的本征值。则 \(T\) 可对角化。

posted @ 2023-06-29 21:31  ez_lcw  阅读(209)  评论(0编辑  收藏  举报