第三章 线性映射
在本书的剩余部分,除特殊说明外,总设 \(W\) 也是在 \(\mathbb F\) 上的向量空间。
3.1 向量空间的线性映射
-
定义 3.1.1(线性映射):称函数 \(T:V\to W\) 为线性映射,当且仅当 \(T\) 满足:
- \(u,v\in V\implies T(u+v)=Tu+Tv\)。
- \(\lambda \in\mathbb F,v\in V\implies T(\lambda v)=\lambda (Tv)\)。
从 \(V\) 到 \(W\) 的所有线性映射的集合记为 \(\mathcal L(V,W)\)。
-
定义 3.1.2(零映射和恒等映射):定义零映射 \(0\in \mathcal L(V,W)\) 为 \(0v:=0\)。定义恒等映射为 \(I\in \mathcal L(V,V)\) 为 \(1v:=v\)。
-
引理 3.1.3:设 \(v_1,\cdots,v_n\) 是 \(V\) 的基,\(w_1,\cdots,w_n\in W\),则存在唯一的 \(T\in \mathcal L(V,W)\) 使得对于任意 \(1\leq i\leq n\) 有 \(Tv_i=w_i\)。
-
定义 3.1.4(\(\mathcal L(V,W)\) 上的加法和乘法):设 \(S,T\in \mathcal L(V,W),\lambda \in\mathbb F\),定义 \(S+T\) 为映射使得 \((S+T)(v)=Sv+Tv\),定义 \(\lambda T\) 为映射使得 \((\lambda T)v=\lambda (Tv)\)。
容易验证 \(S+T,\lambda T\) 都是线性映射。
-
引理 3.1.5:\((\mathcal L(V,W),\mathbb F,+,\times,0)\) 是向量空间。
-
定义 3.1.6(线性映射的乘积):设 \(T\in \mathcal L(U,V),S\in \mathcal L(V,W)\),定义映射 \(ST\) 使得 \((ST)(v)=S(Tv)\)。
容易验证 \(ST\) 是线性映射。
-
引理 3.1.7(线性映射乘积的代数算律):在适应的定义下:
- 结合律:\((T_1T_2)T_3=T_1(T_2T_3)\)。
- 单位元:\(TI=IT=T\)。
- 分配律:\((S_1+S_2)T=S_1T+S_2T\),\(S(T_1+T_2)=ST_1+ST_2\)。
-
引理 3.1.8:设 \(T\in \mathcal L(V,W)\),则 \(T(0)=0\)。
证明:\(T(0)=T(0+0)=T(0)+T(0)\)。
3.2 零空间与值域
-
定义 3.2.1(零空间):设 \(T\in \mathcal L(V,W)\),定义 \(T\) 的零空间为 \(\operatorname{null} T=\{v\in V:Tv=0\}\)。
-
引理 3.2.2:设 \(T\in \mathcal L(V,W)\),则 \(\operatorname{null} T\) 是 \(V\) 的子空间。
-
引理 3.2.3:设 \(T\in \mathcal L(V,W)\),则 \(T\) 是单射当且仅当 \(\operatorname{null} T=\{0\}\)。
-
定义 3.2.4(值域):设 \(T\in \mathcal L(V,W)\),记 \(T\) 的值域为 \(\operatorname{range}T\)。
-
引理 3.2.5:设 \(T\in \mathcal L(V,W)\),则 \(\operatorname{range} T\) 是 \(W\) 的子空间。
-
引理 3.2.6(线性映射基本定理):设 \(V\) 是有限维的,\(T\in \mathcal L(V,W)\),则 \(\operatorname{range} T\) 是有限维的且 \(\dim T=\dim \operatorname{null} T+\dim \operatorname{range} T\)。
证明:考虑 \(\operatorname{null} T\) 的一组基 \(u_1,\cdots,u_m\),将其扩充为 \(V\) 的一组基得到 \(u_1,\cdots,u_m,v_1,\cdots,v_n\)。考虑证明 \(Tv_1,\cdots,Tv_n\) 为 \(\operatorname{range} T\) 的一组基。
-
引理 3.2.7:设 \(V,W\) 是有限维的且 \(\dim V>\dim W\),则 \(V\) 到 \(W\) 的线性映射一定不是单射。
-
引理 3.2.8:设 \(V,W\) 是有限维的且 \(\dim V<\dim W\),则 \(V\) 到 \(W\) 的线性映射一定不是满射。
-
引理 3.2.9:设 \(v_1,\cdots,v_n\) 是 \(V\) 的基,\(T\in\mathcal L(V,W)\) 是单射,那么 \(Tv_1,\cdots,Tv_n\) 是 \(\operatorname{range} T\) 的基。
证明:\(a_1Tv_1+\cdots+a_nTv_n\) 两两不同等价于 \(T(a_1v_1+\cdots+a_nv_n)\) 两两不同。
3.3 矩阵
-
定义 3.3.1(矩阵):设 \(m,n\) 都是正整数,\(m\times n\) 的矩阵 \(A\) 是从 \(\mathbb Z_{1..m}\times \mathbb Z_{1..n}\) 到 \(\mathbb F\) 的映射。
-
定义 3.3.2(线性映射的矩阵):设 \(T\in \mathcal L(V,W)\),\(v_1,\cdots,v_n\) 是 \(V\) 的基,\(w_1,\cdots,w_m\) 是 \(W\) 的基,定义 \(T\) 关于这两组基的矩阵为 \(m\times n\) 的矩阵 \(\mathcal M(T)\) 满足 \(Tv_i=\mathcal M(T)_{1,i}w_1+\cdots+\mathcal M(T)_{m,i}w_m\)。
如果基在上下文中是不自明的,则使用记号 \(\mathcal M(T,(v_1,\cdots,v_n),(w_1,\cdots,w_m))\)。
在本书的剩余部分,除特殊说明外,总设 \(v_1,\cdots,v_n\) 是 \(V\) 的基,\(w_1,\cdots,w_m\) 是 \(W\) 的基。
- 定义 3.3.3(矩阵的加法和标量乘法):略。
- 定义 3.3.4(矩阵乘法):略。
- 引理 3.3.5:在适应的定义下:
- \(\mathcal M(S+T)=\mathcal M(S)+\mathcal M(T)\)。
- \(\mathcal M(\lambda T)=\lambda \mathcal M(T)\)。
- \(\mathcal M(ST)=\mathcal M(S)\mathcal M(T)\)。
- 引理 3.3.6:$\mathcal M $ 是线性映射。
3.4 可逆性与同构的向量空间
-
定义 3.4.1(可逆和逆):设 \(T\in \mathcal L (V,W)\),称 \(T\) 为可逆的,当且仅当 \(T\) 是双射,记它的逆 \(T^{-1}\) 为 \(T\) 的逆映射。
-
引理 3.4.2:设 \(T\in \mathcal L (V,W)\) 且 \(T\) 是可逆的,则 \(T^{-1}\) 是线性映射。
-
定义 3.4.3(同构):若 \(V,W\) 间存在可逆映射,则称 \(V,W\) 是同构的。
-
引理 3.4.4:设 \(V,W\) 是有限维的,则 \(V,W\) 是同构的当且仅当 \(\dim V=\dim W\)。
证明:考虑 \(V\) 的一组基 \(v_1,\cdots,v_n\),证明 \(Tv_1,\cdots,Tv_m\) 是 \(W\) 的一组基即可。而反过来推可以使用引理 3.1.3。
引理 3.4.4 表明,有限维线性空间总是同构于某个 \(n\) 对应的 \(\mathbb F^n\)。
-
引理 3.4.5:设 \(V,W\) 是有限维的,则 \(\mathcal L(V,W)\) 是有限维的且 \(\dim \mathcal L(V,W)=\dim V\times \dim W\)。
证明:设 \(n=\dim V,m=\dim W\),考虑证明 \(\mathcal M:\mathcal L(V,W)\to \mathbb F^{n\times m}\) 是双射。$\mathcal M $ 是单射即证不同的线性变换对应的矩阵不同,$\mathcal M $ 是满射即证任意矩阵都有对应的线性变换。
-
定义 3.4.6(向量的矩阵):设 \(v\in V\),定义 \(\mathcal M(v)\) 为 \(n\times 1\) 的矩阵满足 \(v=\mathcal M(v)_{1}v_1+\cdots+\mathcal M(v)_nv_n\)。
-
引理 3.4.7:在适应的定义下,\(\mathcal M(Tv)=\mathcal M(T)\mathcal M(v)\)。
-
定义 3.4.8(算子):称 \(V\) 到 \(V\) 自身的线性映射为 \(V\) 的算子,记为 \(\mathcal L(V)\)。
-
引理 3.4.9:设 \(V\) 是有限维的,\(T\in \mathcal L(V)\),则下述命题等价:
- \(T\) 是双射。
- \(T\) 是单射。
- \(T\) 是满射。
证明:根据 \(\dim T=\dim\operatorname{null} T+\dim\operatorname{range} T\) 可推知。
3.5 向量空间的积与商
-
定义 3.5.1(向量空间的积):设 \(V_1,\cdots,V_m\) 均为向量空间,则定义它们的积为它们的笛卡尔积。规定它们的积上的加法为 \((u_1,\cdots,u_m)+(v_1,\cdots,v_m)=(u_1+v_1,\cdots,u_m+v_m)\),标量乘法为 \(\lambda(v_1,\cdots,v_m)=(\lambda v_1,\cdots,\lambda v_m)\)。
-
引理 3.5.2:向量空间的积是向量空间。
-
引理 3.5.3:设 \(V_1,\cdots,V_m\) 均为有限维向量空间,那么 \(V_1\times \cdots\times V_m\) 也是有限维向量空间,且 \(\dim(V_1\times \cdots\times V_m)=\dim V_1+\cdots+\dim V_m\)。
-
引理 3.5.4:设 \(U_1,\cdots,U_m\) 均为 \(V\) 的子空间,则 \(U_1+\cdots+U_m\) 是直和当且仅当在 \(\Gamma(u_1,\cdots,u_m):=u_1+\cdots+u_m\) 定义下的 \(\Gamma:U_1\times \cdots\times U_m\to U_1+\cdots+U_m\) 为单射。
证明:等价于对于任意 \((u_1,\cdots,u_m)\neq (v_1,\cdots,v_m)\) 有 \(u_1+\cdots+u_m\neq v_1+\cdots+v_m\)。
-
引理 3.5.5:设 \(U_1,\cdots,U_m\) 是 \(V\) 的子空间且均为有限维的,那么 \(U_1+\cdots+U_m\) 是直和当且仅当 \(\dim(U_1+\cdots+U_m)=\dim U_1+\cdots+\dim U_m\)。
证明:由引理 3.5.4 可知,\(\dim U_1+\cdots+\dim U_m=\dim\operatorname{null} \Gamma+\dim(U_1+\cdots+U_m)\)。
-
定义 3.5.6(仿射子集和平行):设 \(v\in V\),\(U\) 是 \(V\) 的子空间,则称 \(v+U:=\{v+u:u\in U\}\) 是 \(V\) 的仿射子集,称 \(v+U\) 平行于 \(U\)。
-
定义 3.5.7(商空间):设 \(U\) 是 \(V\) 的子空间,定义 \(V/U:=\{v+U:v\in V\}\)。
-
引理 3.5.8:设 \(U\) 是 \(V\) 的子空间,\(v,w\in V\),则下述命题等价:
- \(v-w\in U\)。
- \(v+U=w+U\)。
- \((v+U)\cap (w+U)\neq \varnothing\)。
-
定义 3.5.9(商空间上的加法和标量乘法):设 \(U\) 是 \(V\) 的子空间, \(v,w\in V\),\(\lambda \in \mathbb F\),定义 \((v+U)+(w+U):=(v+w)+U\),\(\lambda(v+U):=(\lambda v)+U\)。
容易证明,该定义是良的。
-
引理 3.5.10:设 \(U\) 是 \(V\) 的子空间,则 \((V/U)\) 是向量空间。
-
定义 3.5.11(商映射):设 \(U\) 是 \(V\) 的子空间,定义 \(\pi:V\to U/V\) 使得 \(\pi(v):=v+U\)。
-
引理 3.5.12:商映射是线性映射。
-
引理 3.5.13:设 \(V\) 是有限维的,\(U\) 是 \(V\) 的子空间,则 \(\dim V/U=\dim V-\dim U\)。
证明:利用构造的商映射证明。
-
定义 3.5.14:设 \(T\in\mathcal L(V,W)\),定义 \(\tilde T:V/\operatorname{null} T\to W\) 使得 \(\tilde T(v+\operatorname{null} T):=Tv\)。
容易证明,该定义是良的。
实际上,\(V/\operatorname{null} T\) 实际上将 \(V\) 中元素划分为若干个等价类,每类中经过 \(T\) 变换后得到的值相同,而这些等价类显然依然满足线性性质。
- 引理 3.5.15:设 \(T\in \mathcal L(V,W)\),则:
- \(\tilde T\) 是线性映射。
- \(\tilde T\) 是单射。
- \(\operatorname{range} \tilde T=\operatorname{range} T\)。
- \(V/\operatorname{null} T\) 同构于 \(\operatorname{range} T\)。
3.6 对偶
//该章节需更深理解
由于本节作者感觉很难理解,所以会有很多感性部分,证明的大多目的也是为了帮助理解。
-
定义 3.6.1(对偶空间和线性泛函):定义 \(V':=\mathcal L(V,\mathbb F)\) 为 \(V\) 的对偶空间,其中的元素为 \(V\) 的线性泛函。
-
引理 3.6.2:\(\dim V=\dim V'\)。
证明:由 \(\dim \mathcal L(V,W)=\dim V\dim W\) 可知。
-
定义 3.6.3(对偶基):设 \(v_1,\cdots,v_n\) 是 \(V\) 的基,则 \(v_1,\cdots,v_n\) 的对偶基是 \(V'\) 中的元素 \(\varphi_1,\cdots,\varphi_n\),其中每个 \(\varphi_j\) 都是 \(V\) 上的线性泛函,使得 \(\varphi_j(v_k):=[j=k]\)(注意 \(\varphi_j\) 是被唯一定义的)。
\(\varphi_j(v)\) 可以看成是提取 \(v\) 的第 \(j\) 维坐标。
-
引理 3.6.4:设 \(V\) 是有限维的,则 \(V\) 的任意一个基的对偶基都是 \(V'\) 的基。
证明:\(f(v)=f(\sum a_iv_i)=\sum a_if(v_i)\),所以我们只需要关心 \(f(v_1),\cdots,f(v_n)\) 的取值即可,那么只需对应地构造 \(f=f(v_1)\varphi_1+\cdots+f(v_n)\varphi_n\) 即可。
\(V\) 中向量是由给 \(V\) 的基赋予系数得到的,\(V\) 到 \(\mathbb F\) 的线性映射(即 \(V'\) 中的元素)是由给 \(V\) 的基赋予权重得到的。
- 定义 3.6.5(对偶映射):设 \(T\in\mathcal L(V,W)\),定义 \(T\) 的对偶映射为 \(T'\in \mathcal L(W',V')\) 使得 \(T'(\varphi)=\varphi\circ T\)(\(f(g(x))=(f\circ g)(x)\))。
给一个函数 \(\varphi\) 套一层 \(T'\) 就是先进行 \(T\) 再进行 \(\varphi\)。
可以理解为,\(\varphi(w)\) 就是根据 \(W\) 的基的权重直接计算 \(w\in W\) 对应的权重,而 \((T'(\varphi))(v)\) 就是要把 \(v\in V\) 先经过线性变换 \(T\) 转到 \(W\) 空间中,再根据 \(W\) 的基的权重进行计算其对应权重。
-
引理 3.6.6:在适应的定义下:
- \((S+T)'=S'+T'\)。
- \((\lambda T)'=\lambda T'\)。
- \((ST)'=T'S'\)。
证明:3:\((ST)'(\varphi)=\varphi\circ (ST)=(\varphi\circ S)\circ T=T'(S'(\varphi))\)。
-
定义 3.6.7(零化子):设 \(U\subseteq V\),定义 \(U\) 的零化子为 \(U^0:=\{\varphi\in V':\forall_{u\in U},\varphi(u)=0\}\)。
考虑这个奇怪的定义,我们进一步挖掘它的一些性质。考虑包含 \(U\) 的最小子空间(即 \(\operatorname{span} U\))为 \(U'\),那么根据线性性质可知对 \(U'\) 中的元素来说 \(\varphi(u)=0\) 仍成立(且这是 \(\forall_{u\in U},\varphi(u)=0\) 的等价条件),于是我们找到 \(U'\) 的一组基 \(v_1,\cdots,v_n\),将其扩展为 \(V\) 的基得到 \(v_1,\cdots,v_n,w_1,\cdots,w_m\)。前面我们说过,\(\varphi\) 相当于是给 \(V\) 的基中的每个向量赋予权重得到,那么发现 \(\forall_{u\in U'},\varphi(u)=0\) 的条件就是 \(v_1,\cdots,v_n\) 的权重为 \(0\),而 \(w_1,\cdots,w_m\) 的权重任取。
-
引理 3.6.8:设 \(U\subseteq V\),则 \(U^0\) 是 \(V'\) 的子空间。
-
引理 3.6.9:设 \(V\) 是有限维的,\(U\) 是 \(V\) 的子空间,则 \(\dim U+\dim U^0=\dim V\)。
-
引理 3.6.10:设 \(T\in\mathcal L(V,W)\)。
-
\(\operatorname{null} T'=(\operatorname{range} T)^0\)。
证明:使得 \(T'(\varphi)=\varphi\circ T=0\) 的 \(\varphi\),必定是使得 \(\varphi (\operatorname{range} T)=0\)(\(\forall_{w\in\operatorname{range} T},\varphi(w)=0\))的 \(\varphi\)。
-
\(\dim \operatorname{null} T'=\dim \operatorname{null} T+\dim W-\dim V\)。
证明:\(\dim\operatorname{null} T'=\dim(\operatorname{range} T)^0=\dim W-\dim \operatorname{range} T=\dim W-(\dim V-\dim \operatorname{null} T)\)。
-
-
引理 3.6.11:\(T\) 是满的等价于 \(T'\) 是单的。
证明:\(T\) 是满的当且仅当 \(\operatorname{range} T=W\),当且仅当 \((\operatorname{range} T)^0=\{0\}\),当且仅当 \(\operatorname{null} T'=\{0\}\),当且仅当 \(T'\) 是单的。
-
引理 3.6.12:设 \(V\) 和 \(W\) 都是有限维的,\(T\in \mathcal L(V,W)\)。
-
\(\dim\operatorname{range} T'=\dim \operatorname{range} T\)。
证明:若 \(\varphi_1,\varphi_2\in\mathcal L(W,\mathbb F)\) 使得 \(\varphi_1\circ T\neq \varphi_2\circ T\),说明存在 \(v\in V\) 使得 \((\varphi_1\circ T)(v)\neq (\varphi_2\circ T)(v)\),说明存在 \(w\in\operatorname{range} T\) 使得 \(\varphi_1(w)\neq \varphi_2(w)\)。考虑 \(\operatorname{range} T\) 的任意一组基 \(v_1,\cdots,v_n\) 并将其扩充至 \(W\) 得到 \(v_1,\cdots,v_n,w_1,\cdots,w_m\),那么上述条件等价于 \(\varphi_1\) 和 \(\varphi_2\) 给 \(v_1,\cdots,v_n\) 设置的权重不同。
-
\(\operatorname{range} T'=(\operatorname{null} T)^0\)。
证明:设 \(\operatorname{null} T\) 的基为 \(w_1,\cdots,w_m\),扩充成为 \(V\) 的基得到 \(v_1,\cdots,v_n,w_1,\cdots,w_n\),那么 \(Tv_1,\cdots,Tv_n\) 就是 \(\operatorname{range} T\) 的基。那么对于任意 \(\varphi\in\mathcal L(W,\mathbb F)\):
\[\begin{aligned} &(\varphi\circ T)(a_1v_1+\cdots+a_nv_n+b_1w_1+\cdots+b_mw_m)\\ =&a_1\varphi(Tv_1)+\cdots+a_n\varphi(Tv_n)+\varphi(T(b_1w_1+\cdots+b_mw_m))\\ =&a_1\varphi(Tv_1)+\cdots+a_n\varphi(Tv_n) \end{aligned} \]而 \(\operatorname{range} T'\) 就是相当于给 \(\varphi(Tv_1),\cdots,\varphi(Tv_n)\) 任意设置权重所形成的所有线性泛函。
而注意到上式可以看成给 \((\varphi\circ T)v_1,\cdots,(\varphi\circ T)v_n\) 任意设置权重所形成的的所有线性泛函,那其实也就是 \((\operatorname{null} T)^0\)(注意为使 \(\operatorname{null} T\) 映到 \(0\) 则 \(w_1,\cdots,w_n\) 的权重都应是 \(0\),这也是吻合的)。
-
-
引理 3.6.13:设 \(V\) 和 \(W\) 都是有限维的,\(T\in\mathcal L(V,W)\),则 \(T\) 是单的等价于 \(T'\) 是满的。
证明:\(T\) 是单的,等价于 “若 \(V\) 的基是 \(v_1,\cdots,v_n\),则 \(\operatorname{range} T\) 的基是 \(Tv_1,\cdots,Tv_n\)”,而根据引理 3.6.12 证明的类似推法,给 \(Tv_1,\cdots,Tv_n\) 设置权重等价于给 \((\varphi\circ T)v_1,\cdots,(\varphi\circ T)v_n\) 设置权重,所以等价于 \(V\) 的任意线性泛函都能取到,即 \(T'\) 是满的。
//可以看出,原书作者对于对偶的理解已经很深入了,以致于不用每次像我都要重新用基的定义来解释一遍引理,而是直接有个明确的方向感推推式子就完了。换言之,每条引理在作者脑海中都已有一个简洁而直观的含义。但我目前还没找到正确的对于对偶的理解方式。
-
定义 3.6.14(转置):略。
-
引理 3.6.15:设 \(V\) 和 \(W\) 都是有限维的,\(T\in \mathcal L(V,W)\),则 \(\mathcal M(T')=\mathcal M(T)^{\mathsf{T}}\)。
证明:设 \(A=\mathcal M(T),C=\mathcal M(T')\)。
实际上,由于 \(T'(\varphi)=\varphi\circ T\),所以 \(T'(\varphi)\) 可以理解为,给定 \(w_1,\cdots,w_m\) 关于 \(\varphi\) 的权重以及 \(T:V\to W\),现在要反推出 \(v_1,\cdots,v_n\) 的关于 \((\varphi\circ T)\) 的权重,这只需要做个代入即可:\(v_i\) 的权重就是 \(\varphi(Tv_i)\) 的值,而 \(\varphi(Tv_i)=\varphi(A_{1,i}w_1+\cdots+A_{n,i}w_n)=A_{1,i}\varphi(w_1)+\cdots+A_{n,i}\varphi(w_n)\)。所以 \(C_{i,j}\) 处(即 \(w_j\) 对 \(v_i\) 的贡献)就应该填 \(A_{j,i}\)(即 \(v_i\) 分解后 \(w_j\) 处的系数)。那么 \(C=A^{\mathsf{T}}\)。
-
引理 3.6.16:在适应的定义下,矩阵 \(A,C\) 满足 \((AC)^{\mathsf{T}}=C^\mathsf{T}A^\mathsf{T}\)。
结合引理 3.6.15 中所述的 \(\mathcal M(T')\) 的 “逆推” 含义,引理 3.6.16 应该是很直观的。
//事实上,由矩阵的角度,容易看出 \((T')'=T\)。但从对偶映射的角度来看好像并不是很显然。
-
定义 3.6.17(行秩和列秩):行秩就是矩阵的每一行对应的向量张成空间的维数,列秩就是矩阵的每一列对应的向量张成空间的维数。
-
引理 3.6.18:设 \(V\) 和 \(W\) 都是有限维的,\(T\in\mathcal L(V,W)\),则 \(\mathcal M(T)\) 的列秩等于 \(\dim\operatorname{range} T\)。
证明:\(\mathcal M(T)\) 的每一列向量即 \(Tv_1,\cdots,Tv_n\),它们的张成空间就是 \(\operatorname{range} T\)。
-
引理 3.6.19:设 \(A\) 为 \(m\) 行 \(n\) 列的矩阵,则 \(A\) 的行秩等于 \(A\) 的列秩。
证明:转为证明 \(A\) 的列秩等于 \(A^{\mathsf T}\) 的列秩,即 \(\dim \operatorname{range} T=\dim\operatorname{range} T'\)。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步