第三章 线性映射

在本书的剩余部分,除特殊说明外,总设 \(W\) 也是在 \(\mathbb F\) 上的向量空间。

3.1 向量空间的线性映射

  • 定义 3.1.1(线性映射):称函数 \(T:V\to W\) 为线性映射,当且仅当 \(T\) 满足:

    1. \(u,v\in V\implies T(u+v)=Tu+Tv\)
    2. \(\lambda \in\mathbb F,v\in V\implies T(\lambda v)=\lambda (Tv)\)

    \(V\)\(W\) 的所有线性映射的集合记为 \(\mathcal L(V,W)\)

  • 定义 3.1.2(零映射和恒等映射):定义零映射 \(0\in \mathcal L(V,W)\)\(0v:=0\)。定义恒等映射为 \(I\in \mathcal L(V,V)\)\(1v:=v\)

  • 引理 3.1.3:设 \(v_1,\cdots,v_n\)\(V\) 的基,\(w_1,\cdots,w_n\in W\),则存在唯一的 \(T\in \mathcal L(V,W)\) 使得对于任意 \(1\leq i\leq n\)\(Tv_i=w_i\)

  • 定义 3.1.4(\(\mathcal L(V,W)\) 上的加法和乘法):设 \(S,T\in \mathcal L(V,W),\lambda \in\mathbb F\),定义 \(S+T\) 为映射使得 \((S+T)(v)=Sv+Tv\),定义 \(\lambda T\) 为映射使得 \((\lambda T)v=\lambda (Tv)\)

    容易验证 \(S+T,\lambda T\) 都是线性映射。

  • 引理 3.1.5\((\mathcal L(V,W),\mathbb F,+,\times,0)\) 是向量空间。

  • 定义 3.1.6(线性映射的乘积):设 \(T\in \mathcal L(U,V),S\in \mathcal L(V,W)\),定义映射 \(ST\) 使得 \((ST)(v)=S(Tv)\)

    容易验证 \(ST\) 是线性映射。

  • 引理 3.1.7(线性映射乘积的代数算律):在适应的定义下:

    • 结合律:\((T_1T_2)T_3=T_1(T_2T_3)\)
    • 单位元:\(TI=IT=T\)
    • 分配律:\((S_1+S_2)T=S_1T+S_2T\)\(S(T_1+T_2)=ST_1+ST_2\)
  • 引理 3.1.8:设 \(T\in \mathcal L(V,W)\),则 \(T(0)=0\)

    证明\(T(0)=T(0+0)=T(0)+T(0)\)

3.2 零空间与值域

  • 定义 3.2.1(零空间):设 \(T\in \mathcal L(V,W)\),定义 \(T\) 的零空间为 \(\operatorname{null} T=\{v\in V:Tv=0\}\)

  • 引理 3.2.2:设 \(T\in \mathcal L(V,W)\),则 \(\operatorname{null} T\)\(V\) 的子空间。

  • 引理 3.2.3:设 \(T\in \mathcal L(V,W)\),则 \(T\) 是单射当且仅当 \(\operatorname{null} T=\{0\}\)

  • 定义 3.2.4(值域):设 \(T\in \mathcal L(V,W)\),记 \(T\) 的值域为 \(\operatorname{range}T\)

  • 引理 3.2.5:设 \(T\in \mathcal L(V,W)\),则 \(\operatorname{range} T\)\(W\) 的子空间。

  • 引理 3.2.6(线性映射基本定理):设 \(V\) 是有限维的,\(T\in \mathcal L(V,W)\),则 \(\operatorname{range} T\) 是有限维的且 \(\dim T=\dim \operatorname{null} T+\dim \operatorname{range} T\)

    证明:考虑 \(\operatorname{null} T\) 的一组基 \(u_1,\cdots,u_m\),将其扩充为 \(V\) 的一组基得到 \(u_1,\cdots,u_m,v_1,\cdots,v_n\)。考虑证明 \(Tv_1,\cdots,Tv_n\)\(\operatorname{range} T\) 的一组基。

  • 引理 3.2.7:设 \(V,W\) 是有限维的且 \(\dim V>\dim W\),则 \(V\)\(W\) 的线性映射一定不是单射。

  • 引理 3.2.8:设 \(V,W\) 是有限维的且 \(\dim V<\dim W\),则 \(V\)\(W\) 的线性映射一定不是满射。

  • 引理 3.2.9:设 \(v_1,\cdots,v_n\)\(V\) 的基,\(T\in\mathcal L(V,W)\) 是单射,那么 \(Tv_1,\cdots,Tv_n\)\(\operatorname{range} T\) 的基。

    证明\(a_1Tv_1+\cdots+a_nTv_n\) 两两不同等价于 \(T(a_1v_1+\cdots+a_nv_n)\) 两两不同。

3.3 矩阵

  • 定义 3.3.1(矩阵):设 \(m,n\) 都是正整数,\(m\times n\) 的矩阵 \(A\) 是从 \(\mathbb Z_{1..m}\times \mathbb Z_{1..n}\)\(\mathbb F\) 的映射。

  • 定义 3.3.2(线性映射的矩阵):设 \(T\in \mathcal L(V,W)\)\(v_1,\cdots,v_n\)\(V\) 的基,\(w_1,\cdots,w_m\)\(W\) 的基,定义 \(T\) 关于这两组基的矩阵为 \(m\times n\) 的矩阵 \(\mathcal M(T)\) 满足 \(Tv_i=\mathcal M(T)_{1,i}w_1+\cdots+\mathcal M(T)_{m,i}w_m\)

    如果基在上下文中是不自明的,则使用记号 \(\mathcal M(T,(v_1,\cdots,v_n),(w_1,\cdots,w_m))\)

在本书的剩余部分,除特殊说明外,总设 \(v_1,\cdots,v_n\)\(V\) 的基,\(w_1,\cdots,w_m\)\(W\) 的基。

  • 定义 3.3.3(矩阵的加法和标量乘法):略。
  • 定义 3.3.4(矩阵乘法):略。
  • 引理 3.3.5:在适应的定义下:
    • \(\mathcal M(S+T)=\mathcal M(S)+\mathcal M(T)\)
    • \(\mathcal M(\lambda T)=\lambda \mathcal M(T)\)
    • \(\mathcal M(ST)=\mathcal M(S)\mathcal M(T)\)
  • 引理 3.3.6:$\mathcal M $ 是线性映射。

3.4 可逆性与同构的向量空间

  • 定义 3.4.1(可逆和逆):设 \(T\in \mathcal L (V,W)\),称 \(T\) 为可逆的,当且仅当 \(T\) 是双射,记它的逆 \(T^{-1}\)\(T\) 的逆映射。

  • 引理 3.4.2:设 \(T\in \mathcal L (V,W)\)\(T\) 是可逆的,则 \(T^{-1}\) 是线性映射。

  • 定义 3.4.3(同构):若 \(V,W\) 间存在可逆映射,则称 \(V,W\) 是同构的。

  • 引理 3.4.4:设 \(V,W\) 是有限维的,则 \(V,W\) 是同构的当且仅当 \(\dim V=\dim W\)

    证明:考虑 \(V\) 的一组基 \(v_1,\cdots,v_n\),证明 \(Tv_1,\cdots,Tv_m\)\(W\) 的一组基即可。而反过来推可以使用引理 3.1.3。

引理 3.4.4 表明,有限维线性空间总是同构于某个 \(n\) 对应的 \(\mathbb F^n\)

  • 引理 3.4.5:设 \(V,W\) 是有限维的,则 \(\mathcal L(V,W)\) 是有限维的且 \(\dim \mathcal L(V,W)=\dim V\times \dim W\)

    证明:设 \(n=\dim V,m=\dim W\),考虑证明 \(\mathcal M:\mathcal L(V,W)\to \mathbb F^{n\times m}\) 是双射。$\mathcal M $ 是单射即证不同的线性变换对应的矩阵不同,$\mathcal M $ 是满射即证任意矩阵都有对应的线性变换。

  • 定义 3.4.6(向量的矩阵):设 \(v\in V\),定义 \(\mathcal M(v)\)\(n\times 1\) 的矩阵满足 \(v=\mathcal M(v)_{1}v_1+\cdots+\mathcal M(v)_nv_n\)

  • 引理 3.4.7:在适应的定义下,\(\mathcal M(Tv)=\mathcal M(T)\mathcal M(v)\)

  • 定义 3.4.8(算子):称 \(V\)\(V\) 自身的线性映射为 \(V\) 的算子,记为 \(\mathcal L(V)\)

  • 引理 3.4.9:设 \(V\) 是有限维的,\(T\in \mathcal L(V)\),则下述命题等价:

    1. \(T\) 是双射。
    2. \(T\) 是单射。
    3. \(T\) 是满射。

    证明:根据 \(\dim T=\dim\operatorname{null} T+\dim\operatorname{range} T\) 可推知。

3.5 向量空间的积与商

  • 定义 3.5.1(向量空间的积):设 \(V_1,\cdots,V_m\) 均为向量空间,则定义它们的积为它们的笛卡尔积。规定它们的积上的加法为 \((u_1,\cdots,u_m)+(v_1,\cdots,v_m)=(u_1+v_1,\cdots,u_m+v_m)\),标量乘法为 \(\lambda(v_1,\cdots,v_m)=(\lambda v_1,\cdots,\lambda v_m)\)

  • 引理 3.5.2:向量空间的积是向量空间。

  • 引理 3.5.3:设 \(V_1,\cdots,V_m\) 均为有限维向量空间,那么 \(V_1\times \cdots\times V_m\) 也是有限维向量空间,且 \(\dim(V_1\times \cdots\times V_m)=\dim V_1+\cdots+\dim V_m\)

  • 引理 3.5.4:设 \(U_1,\cdots,U_m\) 均为 \(V\) 的子空间,则 \(U_1+\cdots+U_m\) 是直和当且仅当在 \(\Gamma(u_1,\cdots,u_m):=u_1+\cdots+u_m\) 定义下的 \(\Gamma:U_1\times \cdots\times U_m\to U_1+\cdots+U_m\) 为单射。

    证明:等价于对于任意 \((u_1,\cdots,u_m)\neq (v_1,\cdots,v_m)\)\(u_1+\cdots+u_m\neq v_1+\cdots+v_m\)

  • 引理 3.5.5:设 \(U_1,\cdots,U_m\)\(V\) 的子空间且均为有限维的,那么 \(U_1+\cdots+U_m\) 是直和当且仅当 \(\dim(U_1+\cdots+U_m)=\dim U_1+\cdots+\dim U_m\)

    证明:由引理 3.5.4 可知,\(\dim U_1+\cdots+\dim U_m=\dim\operatorname{null} \Gamma+\dim(U_1+\cdots+U_m)\)

  • 定义 3.5.6(仿射子集和平行):设 \(v\in V\)\(U\)\(V\) 的子空间,则称 \(v+U:=\{v+u:u\in U\}\)\(V\) 的仿射子集,称 \(v+U\) 平行于 \(U\)

  • 定义 3.5.7(商空间):设 \(U\)\(V\) 的子空间,定义 \(V/U:=\{v+U:v\in V\}\)

  • 引理 3.5.8:设 \(U\)\(V\) 的子空间,\(v,w\in V\),则下述命题等价:

    1. \(v-w\in U\)
    2. \(v+U=w+U\)
    3. \((v+U)\cap (w+U)\neq \varnothing\)
  • 定义 3.5.9(商空间上的加法和标量乘法):设 \(U\)\(V\) 的子空间, \(v,w\in V\)\(\lambda \in \mathbb F\),定义 \((v+U)+(w+U):=(v+w)+U\)\(\lambda(v+U):=(\lambda v)+U\)

    容易证明,该定义是良的。

  • 引理 3.5.10:设 \(U\)\(V\) 的子空间,则 \((V/U)\) 是向量空间。

  • 定义 3.5.11(商映射):设 \(U\)\(V\) 的子空间,定义 \(\pi:V\to U/V\) 使得 \(\pi(v):=v+U\)

  • 引理 3.5.12:商映射是线性映射。

  • 引理 3.5.13:设 \(V\) 是有限维的,\(U\)\(V\) 的子空间,则 \(\dim V/U=\dim V-\dim U\)

    证明:利用构造的商映射证明。

  • 定义 3.5.14:设 \(T\in\mathcal L(V,W)\),定义 \(\tilde T:V/\operatorname{null} T\to W\) 使得 \(\tilde T(v+\operatorname{null} T):=Tv\)

    容易证明,该定义是良的。

实际上,\(V/\operatorname{null} T\) 实际上将 \(V\) 中元素划分为若干个等价类,每类中经过 \(T\) 变换后得到的值相同,而这些等价类显然依然满足线性性质。

  • 引理 3.5.15:设 \(T\in \mathcal L(V,W)\),则:
    1. \(\tilde T\) 是线性映射。
    2. \(\tilde T\) 是单射。
    3. \(\operatorname{range} \tilde T=\operatorname{range} T\)
    4. \(V/\operatorname{null} T\) 同构于 \(\operatorname{range} T\)

3.6 对偶

//该章节需更深理解

由于本节作者感觉很难理解,所以会有很多感性部分,证明的大多目的也是为了帮助理解。

  • 定义 3.6.1(对偶空间和线性泛函):定义 \(V':=\mathcal L(V,\mathbb F)\)\(V\) 的对偶空间,其中的元素为 \(V\) 的线性泛函。

  • 引理 3.6.2\(\dim V=\dim V'\)

    证明:由 \(\dim \mathcal L(V,W)=\dim V\dim W\) 可知。

  • 定义 3.6.3(对偶基):设 \(v_1,\cdots,v_n\)\(V\) 的基,则 \(v_1,\cdots,v_n\) 的对偶基是 \(V'\) 中的元素 \(\varphi_1,\cdots,\varphi_n\),其中每个 \(\varphi_j\) 都是 \(V\) 上的线性泛函,使得 \(\varphi_j(v_k):=[j=k]\)(注意 \(\varphi_j\) 是被唯一定义的)。

\(\varphi_j(v)\) 可以看成是提取 \(v\) 的第 \(j\) 维坐标。

  • 引理 3.6.4:设 \(V\) 是有限维的,则 \(V\) 的任意一个基的对偶基都是 \(V'\) 的基。

    证明\(f(v)=f(\sum a_iv_i)=\sum a_if(v_i)\),所以我们只需要关心 \(f(v_1),\cdots,f(v_n)\) 的取值即可,那么只需对应地构造 \(f=f(v_1)\varphi_1+\cdots+f(v_n)\varphi_n\) 即可。

\(V\) 中向量是由给 \(V\) 的基赋予系数得到的,\(V\)\(\mathbb F\) 的线性映射(即 \(V'\) 中的元素)是由给 \(V\) 的基赋予权重得到的。

  • 定义 3.6.5(对偶映射):设 \(T\in\mathcal L(V,W)\),定义 \(T\) 的对偶映射为 \(T'\in \mathcal L(W',V')\) 使得 \(T'(\varphi)=\varphi\circ T\)\(f(g(x))=(f\circ g)(x)\))。

给一个函数 \(\varphi\) 套一层 \(T'\) 就是先进行 \(T\) 再进行 \(\varphi\)

可以理解为,\(\varphi(w)\) 就是根据 \(W\) 的基的权重直接计算 \(w\in W\) 对应的权重,而 \((T'(\varphi))(v)\) 就是要把 \(v\in V\) 先经过线性变换 \(T\) 转到 \(W\) 空间中,再根据 \(W\) 的基的权重进行计算其对应权重。

  • 引理 3.6.6:在适应的定义下:

    1. \((S+T)'=S'+T'\)
    2. \((\lambda T)'=\lambda T'\)
    3. \((ST)'=T'S'\)

    证明:3:\((ST)'(\varphi)=\varphi\circ (ST)=(\varphi\circ S)\circ T=T'(S'(\varphi))\)

  • 定义 3.6.7(零化子):设 \(U\subseteq V\),定义 \(U\) 的零化子为 \(U^0:=\{\varphi\in V':\forall_{u\in U},\varphi(u)=0\}\)

考虑这个奇怪的定义,我们进一步挖掘它的一些性质。考虑包含 \(U\) 的最小子空间(即 \(\operatorname{span} U\))为 \(U'\),那么根据线性性质可知对 \(U'\) 中的元素来说 \(\varphi(u)=0\) 仍成立(且这是 \(\forall_{u\in U},\varphi(u)=0\) 的等价条件),于是我们找到 \(U'\) 的一组基 \(v_1,\cdots,v_n\),将其扩展为 \(V\) 的基得到 \(v_1,\cdots,v_n,w_1,\cdots,w_m\)。前面我们说过,\(\varphi\) 相当于是给 \(V\) 的基中的每个向量赋予权重得到,那么发现 \(\forall_{u\in U'},\varphi(u)=0\) 的条件就是 \(v_1,\cdots,v_n\) 的权重为 \(0\),而 \(w_1,\cdots,w_m\) 的权重任取。

  • 引理 3.6.8:设 \(U\subseteq V\),则 \(U^0\)\(V'\) 的子空间。

  • 引理 3.6.9:设 \(V\) 是有限维的,\(U\)\(V\) 的子空间,则 \(\dim U+\dim U^0=\dim V\)

  • 引理 3.6.10:设 \(T\in\mathcal L(V,W)\)

    1. \(\operatorname{null} T'=(\operatorname{range} T)^0\)

      证明:使得 \(T'(\varphi)=\varphi\circ T=0\)\(\varphi\),必定是使得 \(\varphi (\operatorname{range} T)=0\)\(\forall_{w\in\operatorname{range} T},\varphi(w)=0\))的 \(\varphi\)

    2. \(\dim \operatorname{null} T'=\dim \operatorname{null} T+\dim W-\dim V\)

      证明\(\dim\operatorname{null} T'=\dim(\operatorname{range} T)^0=\dim W-\dim \operatorname{range} T=\dim W-(\dim V-\dim \operatorname{null} T)\)

  • 引理 3.6.11\(T\) 是满的等价于 \(T'\) 是单的。

    证明\(T\) 是满的当且仅当 \(\operatorname{range} T=W\),当且仅当 \((\operatorname{range} T)^0=\{0\}\),当且仅当 \(\operatorname{null} T'=\{0\}\),当且仅当 \(T'\) 是单的。

  • 引理 3.6.12:设 \(V\)\(W\) 都是有限维的,\(T\in \mathcal L(V,W)\)

    1. \(\dim\operatorname{range} T'=\dim \operatorname{range} T\)

      证明:若 \(\varphi_1,\varphi_2\in\mathcal L(W,\mathbb F)\) 使得 \(\varphi_1\circ T\neq \varphi_2\circ T\),说明存在 \(v\in V\) 使得 \((\varphi_1\circ T)(v)\neq (\varphi_2\circ T)(v)\),说明存在 \(w\in\operatorname{range} T\) 使得 \(\varphi_1(w)\neq \varphi_2(w)\)。考虑 \(\operatorname{range} T\) 的任意一组基 \(v_1,\cdots,v_n\) 并将其扩充至 \(W\) 得到 \(v_1,\cdots,v_n,w_1,\cdots,w_m\),那么上述条件等价于 \(\varphi_1\)\(\varphi_2\)\(v_1,\cdots,v_n\) 设置的权重不同。

    2. \(\operatorname{range} T'=(\operatorname{null} T)^0\)

      证明:设 \(\operatorname{null} T\) 的基为 \(w_1,\cdots,w_m\),扩充成为 \(V\) 的基得到 \(v_1,\cdots,v_n,w_1,\cdots,w_n\),那么 \(Tv_1,\cdots,Tv_n\) 就是 \(\operatorname{range} T\) 的基。那么对于任意 \(\varphi\in\mathcal L(W,\mathbb F)\)

      \[\begin{aligned} &(\varphi\circ T)(a_1v_1+\cdots+a_nv_n+b_1w_1+\cdots+b_mw_m)\\ =&a_1\varphi(Tv_1)+\cdots+a_n\varphi(Tv_n)+\varphi(T(b_1w_1+\cdots+b_mw_m))\\ =&a_1\varphi(Tv_1)+\cdots+a_n\varphi(Tv_n) \end{aligned} \]

      \(\operatorname{range} T'\) 就是相当于给 \(\varphi(Tv_1),\cdots,\varphi(Tv_n)\) 任意设置权重所形成的所有线性泛函。

      而注意到上式可以看成给 \((\varphi\circ T)v_1,\cdots,(\varphi\circ T)v_n\) 任意设置权重所形成的的所有线性泛函,那其实也就是 \((\operatorname{null} T)^0\)(注意为使 \(\operatorname{null} T\) 映到 \(0\)\(w_1,\cdots,w_n\) 的权重都应是 \(0\),这也是吻合的)。

  • 引理 3.6.13:设 \(V\)\(W\) 都是有限维的,\(T\in\mathcal L(V,W)\),则 \(T\) 是单的等价于 \(T'\) 是满的。

    证明\(T\) 是单的,等价于 “若 \(V\) 的基是 \(v_1,\cdots,v_n\),则 \(\operatorname{range} T\) 的基是 \(Tv_1,\cdots,Tv_n\)”,而根据引理 3.6.12 证明的类似推法,给 \(Tv_1,\cdots,Tv_n\) 设置权重等价于给 \((\varphi\circ T)v_1,\cdots,(\varphi\circ T)v_n\) 设置权重,所以等价于 \(V\) 的任意线性泛函都能取到,即 \(T'\) 是满的。

//可以看出,原书作者对于对偶的理解已经很深入了,以致于不用每次像我都要重新用基的定义来解释一遍引理,而是直接有个明确的方向感推推式子就完了。换言之,每条引理在作者脑海中都已有一个简洁而直观的含义。但我目前还没找到正确的对于对偶的理解方式。

  • 定义 3.6.14(转置):略。

  • 引理 3.6.15:设 \(V\)\(W\) 都是有限维的,\(T\in \mathcal L(V,W)\),则 \(\mathcal M(T')=\mathcal M(T)^{\mathsf{T}}\)

    证明:设 \(A=\mathcal M(T),C=\mathcal M(T')\)

    实际上,由于 \(T'(\varphi)=\varphi\circ T\),所以 \(T'(\varphi)\) 可以理解为,给定 \(w_1,\cdots,w_m\) 关于 \(\varphi\) 的权重以及 \(T:V\to W\),现在要反推出 \(v_1,\cdots,v_n\) 的关于 \((\varphi\circ T)\) 的权重,这只需要做个代入即可:\(v_i\) 的权重就是 \(\varphi(Tv_i)\) 的值,而 \(\varphi(Tv_i)=\varphi(A_{1,i}w_1+\cdots+A_{n,i}w_n)=A_{1,i}\varphi(w_1)+\cdots+A_{n,i}\varphi(w_n)\)。所以 \(C_{i,j}\) 处(即 \(w_j\)\(v_i\) 的贡献)就应该填 \(A_{j,i}\)(即 \(v_i\) 分解后 \(w_j\) 处的系数)。那么 \(C=A^{\mathsf{T}}\)

  • 引理 3.6.16:在适应的定义下,矩阵 \(A,C\) 满足 \((AC)^{\mathsf{T}}=C^\mathsf{T}A^\mathsf{T}\)

结合引理 3.6.15 中所述的 \(\mathcal M(T')\) 的 “逆推” 含义,引理 3.6.16 应该是很直观的。

//事实上,由矩阵的角度,容易看出 \((T')'=T\)。但从对偶映射的角度来看好像并不是很显然。

  • 定义 3.6.17(行秩和列秩):行秩就是矩阵的每一行对应的向量张成空间的维数,列秩就是矩阵的每一列对应的向量张成空间的维数。

  • 引理 3.6.18:设 \(V\)\(W\) 都是有限维的,\(T\in\mathcal L(V,W)\),则 \(\mathcal M(T)\) 的列秩等于 \(\dim\operatorname{range} T\)

    证明\(\mathcal M(T)\) 的每一列向量即 \(Tv_1,\cdots,Tv_n\),它们的张成空间就是 \(\operatorname{range} T\)

  • 引理 3.6.19:设 \(A\)\(m\)\(n\) 列的矩阵,则 \(A\) 的行秩等于 \(A\) 的列秩。

    证明:转为证明 \(A\) 的列秩等于 \(A^{\mathsf T}\) 的列秩,即 \(\dim \operatorname{range} T=\dim\operatorname{range} T'\)

posted @ 2022-12-15 21:12  ez_lcw  阅读(358)  评论(0编辑  收藏  举报