在本书的剩余部分,除特殊说明外,总设 W 也是在 F 上的向量空间。
3.1 向量空间的线性映射
-
定义 3.1.1(线性映射):称函数 T:V→W 为线性映射,当且仅当 T 满足:
- u,v∈V⟹T(u+v)=Tu+Tv。
- λ∈F,v∈V⟹T(λv)=λ(Tv)。
从 V 到 W 的所有线性映射的集合记为 L(V,W)。
-
定义 3.1.2(零映射和恒等映射):定义零映射 0∈L(V,W) 为 0v:=0。定义恒等映射为 I∈L(V,V) 为 1v:=v。
-
引理 3.1.3:设 v1,⋯,vn 是 V 的基,w1,⋯,wn∈W,则存在唯一的 T∈L(V,W) 使得对于任意 1≤i≤n 有 Tvi=wi。
-
定义 3.1.4(L(V,W) 上的加法和乘法):设 S,T∈L(V,W),λ∈F,定义 S+T 为映射使得 (S+T)(v)=Sv+Tv,定义 λT 为映射使得 (λT)v=λ(Tv)。
容易验证 S+T,λT 都是线性映射。
-
引理 3.1.5:(L(V,W),F,+,×,0) 是向量空间。
-
定义 3.1.6(线性映射的乘积):设 T∈L(U,V),S∈L(V,W),定义映射 ST 使得 (ST)(v)=S(Tv)。
容易验证 ST 是线性映射。
-
引理 3.1.7(线性映射乘积的代数算律):在适应的定义下:
- 结合律:(T1T2)T3=T1(T2T3)。
- 单位元:TI=IT=T。
- 分配律:(S1+S2)T=S1T+S2T,S(T1+T2)=ST1+ST2。
-
引理 3.1.8:设 T∈L(V,W),则 T(0)=0。
证明:T(0)=T(0+0)=T(0)+T(0)。
3.2 零空间与值域
-
定义 3.2.1(零空间):设 T∈L(V,W),定义 T 的零空间为 nullT={v∈V:Tv=0}。
-
引理 3.2.2:设 T∈L(V,W),则 nullT 是 V 的子空间。
-
引理 3.2.3:设 T∈L(V,W),则 T 是单射当且仅当 nullT={0}。
-
定义 3.2.4(值域):设 T∈L(V,W),记 T 的值域为 rangeT。
-
引理 3.2.5:设 T∈L(V,W),则 rangeT 是 W 的子空间。
-
引理 3.2.6(线性映射基本定理):设 V 是有限维的,T∈L(V,W),则 rangeT 是有限维的且 dimT=dimnullT+dimrangeT。
证明:考虑 nullT 的一组基 u1,⋯,um,将其扩充为 V 的一组基得到 u1,⋯,um,v1,⋯,vn。考虑证明 Tv1,⋯,Tvn 为 rangeT 的一组基。
-
引理 3.2.7:设 V,W 是有限维的且 dimV>dimW,则 V 到 W 的线性映射一定不是单射。
-
引理 3.2.8:设 V,W 是有限维的且 dimV<dimW,则 V 到 W 的线性映射一定不是满射。
-
引理 3.2.9:设 v1,⋯,vn 是 V 的基,T∈L(V,W) 是单射,那么 Tv1,⋯,Tvn 是 rangeT 的基。
证明:a1Tv1+⋯+anTvn 两两不同等价于 T(a1v1+⋯+anvn) 两两不同。
3.3 矩阵
-
定义 3.3.1(矩阵):设 m,n 都是正整数,m×n 的矩阵 A 是从 Z1..m×Z1..n 到 F 的映射。
-
定义 3.3.2(线性映射的矩阵):设 T∈L(V,W),v1,⋯,vn 是 V 的基,w1,⋯,wm 是 W 的基,定义 T 关于这两组基的矩阵为 m×n 的矩阵 M(T) 满足 Tvi=M(T)1,iw1+⋯+M(T)m,iwm。
如果基在上下文中是不自明的,则使用记号 M(T,(v1,⋯,vn),(w1,⋯,wm))。
在本书的剩余部分,除特殊说明外,总设 v1,⋯,vn 是 V 的基,w1,⋯,wm 是 W 的基。
- 定义 3.3.3(矩阵的加法和标量乘法):略。
- 定义 3.3.4(矩阵乘法):略。
- 引理 3.3.5:在适应的定义下:
- M(S+T)=M(S)+M(T)。
- M(λT)=λM(T)。
- M(ST)=M(S)M(T)。
- 引理 3.3.6:M 是线性映射。
3.4 可逆性与同构的向量空间
-
定义 3.4.1(可逆和逆):设 T∈L(V,W),称 T 为可逆的,当且仅当 T 是双射,记它的逆 T−1 为 T 的逆映射。
-
引理 3.4.2:设 T∈L(V,W) 且 T 是可逆的,则 T−1 是线性映射。
-
定义 3.4.3(同构):若 V,W 间存在可逆映射,则称 V,W 是同构的。
-
引理 3.4.4:设 V,W 是有限维的,则 V,W 是同构的当且仅当 dimV=dimW。
证明:考虑 V 的一组基 v1,⋯,vn,证明 Tv1,⋯,Tvm 是 W 的一组基即可。而反过来推可以使用引理 3.1.3。
引理 3.4.4 表明,有限维线性空间总是同构于某个 n 对应的 Fn。
-
引理 3.4.5:设 V,W 是有限维的,则 L(V,W) 是有限维的且 dimL(V,W)=dimV×dimW。
证明:设 n=dimV,m=dimW,考虑证明 M:L(V,W)→Fn×m 是双射。M 是单射即证不同的线性变换对应的矩阵不同,M 是满射即证任意矩阵都有对应的线性变换。
-
定义 3.4.6(向量的矩阵):设 v∈V,定义 M(v) 为 n×1 的矩阵满足 v=M(v)1v1+⋯+M(v)nvn。
-
引理 3.4.7:在适应的定义下,M(Tv)=M(T)M(v)。
-
定义 3.4.8(算子):称 V 到 V 自身的线性映射为 V 的算子,记为 L(V)。
-
引理 3.4.9:设 V 是有限维的,T∈L(V),则下述命题等价:
- T 是双射。
- T 是单射。
- T 是满射。
证明:根据 dimT=dimnullT+dimrangeT 可推知。
3.5 向量空间的积与商
-
定义 3.5.1(向量空间的积):设 V1,⋯,Vm 均为向量空间,则定义它们的积为它们的笛卡尔积。规定它们的积上的加法为 (u1,⋯,um)+(v1,⋯,vm)=(u1+v1,⋯,um+vm),标量乘法为 λ(v1,⋯,vm)=(λv1,⋯,λvm)。
-
引理 3.5.2:向量空间的积是向量空间。
-
引理 3.5.3:设 V1,⋯,Vm 均为有限维向量空间,那么 V1×⋯×Vm 也是有限维向量空间,且 dim(V1×⋯×Vm)=dimV1+⋯+dimVm。
-
引理 3.5.4:设 U1,⋯,Um 均为 V 的子空间,则 U1+⋯+Um 是直和当且仅当在 Γ(u1,⋯,um):=u1+⋯+um 定义下的 Γ:U1×⋯×Um→U1+⋯+Um 为单射。
证明:等价于对于任意 (u1,⋯,um)≠(v1,⋯,vm) 有 u1+⋯+um≠v1+⋯+vm。
-
引理 3.5.5:设 U1,⋯,Um 是 V 的子空间且均为有限维的,那么 U1+⋯+Um 是直和当且仅当 dim(U1+⋯+Um)=dimU1+⋯+dimUm。
证明:由引理 3.5.4 可知,dimU1+⋯+dimUm=dimnullΓ+dim(U1+⋯+Um)。
-
定义 3.5.6(仿射子集和平行):设 v∈V,U 是 V 的子空间,则称 v+U:={v+u:u∈U} 是 V 的仿射子集,称 v+U 平行于 U。
-
定义 3.5.7(商空间):设 U 是 V 的子空间,定义 V/U:={v+U:v∈V}。
-
引理 3.5.8:设 U 是 V 的子空间,v,w∈V,则下述命题等价:
- v−w∈U。
- v+U=w+U。
- (v+U)∩(w+U)≠∅。
-
定义 3.5.9(商空间上的加法和标量乘法):设 U 是 V 的子空间, v,w∈V,λ∈F,定义 (v+U)+(w+U):=(v+w)+U,λ(v+U):=(λv)+U。
容易证明,该定义是良的。
-
引理 3.5.10:设 U 是 V 的子空间,则 (V/U) 是向量空间。
-
定义 3.5.11(商映射):设 U 是 V 的子空间,定义 π:V→U/V 使得 π(v):=v+U。
-
引理 3.5.12:商映射是线性映射。
-
引理 3.5.13:设 V 是有限维的,U 是 V 的子空间,则 dimV/U=dimV−dimU。
证明:利用构造的商映射证明。
-
定义 3.5.14:设 T∈L(V,W),定义 ~T:V/nullT→W 使得 ~T(v+nullT):=Tv。
容易证明,该定义是良的。
实际上,V/nullT 实际上将 V 中元素划分为若干个等价类,每类中经过 T 变换后得到的值相同,而这些等价类显然依然满足线性性质。
- 引理 3.5.15:设 T∈L(V,W),则:
- ~T 是线性映射。
- ~T 是单射。
- range~T=rangeT。
- V/nullT 同构于 rangeT。
3.6 对偶
//该章节需更深理解
由于本节作者感觉很难理解,所以会有很多感性部分,证明的大多目的也是为了帮助理解。
-
定义 3.6.1(对偶空间和线性泛函):定义 V′:=L(V,F) 为 V 的对偶空间,其中的元素为 V 的线性泛函。
-
引理 3.6.2:dimV=dimV′。
证明:由 dimL(V,W)=dimVdimW 可知。
-
定义 3.6.3(对偶基):设 v1,⋯,vn 是 V 的基,则 v1,⋯,vn 的对偶基是 V′ 中的元素 φ1,⋯,φn,其中每个 φj 都是 V 上的线性泛函,使得 φj(vk):=[j=k](注意 φj 是被唯一定义的)。
φj(v) 可以看成是提取 v 的第 j 维坐标。
-
引理 3.6.4:设 V 是有限维的,则 V 的任意一个基的对偶基都是 V′ 的基。
证明:f(v)=f(∑aivi)=∑aif(vi),所以我们只需要关心 f(v1),⋯,f(vn) 的取值即可,那么只需对应地构造 f=f(v1)φ1+⋯+f(vn)φn 即可。
V 中向量是由给 V 的基赋予系数得到的,V 到 F 的线性映射(即 V′ 中的元素)是由给 V 的基赋予权重得到的。
- 定义 3.6.5(对偶映射):设 T∈L(V,W),定义 T 的对偶映射为 T′∈L(W′,V′) 使得 T′(φ)=φ∘T(f(g(x))=(f∘g)(x))。
给一个函数 φ 套一层 T′ 就是先进行 T 再进行 φ。
可以理解为,φ(w) 就是根据 W 的基的权重直接计算 w∈W 对应的权重,而 (T′(φ))(v) 就是要把 v∈V 先经过线性变换 T 转到 W 空间中,再根据 W 的基的权重进行计算其对应权重。
-
引理 3.6.6:在适应的定义下:
- (S+T)′=S′+T′。
- (λT)′=λT′。
- (ST)′=T′S′。
证明:3:(ST)′(φ)=φ∘(ST)=(φ∘S)∘T=T′(S′(φ))。
-
定义 3.6.7(零化子):设 U⊆V,定义 U 的零化子为 U0:={φ∈V′:∀u∈U,φ(u)=0}。
考虑这个奇怪的定义,我们进一步挖掘它的一些性质。考虑包含 U 的最小子空间(即 spanU)为 U′,那么根据线性性质可知对 U′ 中的元素来说 φ(u)=0 仍成立(且这是 ∀u∈U,φ(u)=0 的等价条件),于是我们找到 U′ 的一组基 v1,⋯,vn,将其扩展为 V 的基得到 v1,⋯,vn,w1,⋯,wm。前面我们说过,φ 相当于是给 V 的基中的每个向量赋予权重得到,那么发现 ∀u∈U′,φ(u)=0 的条件就是 v1,⋯,vn 的权重为 0,而 w1,⋯,wm 的权重任取。
-
引理 3.6.8:设 U⊆V,则 U0 是 V′ 的子空间。
-
引理 3.6.9:设 V 是有限维的,U 是 V 的子空间,则 dimU+dimU0=dimV。
-
引理 3.6.10:设 T∈L(V,W)。
-
nullT′=(rangeT)0。
证明:使得 T′(φ)=φ∘T=0 的 φ,必定是使得 φ(rangeT)=0(∀w∈rangeT,φ(w)=0)的 φ。
-
dimnullT′=dimnullT+dimW−dimV。
证明:dimnullT′=dim(rangeT)0=dimW−dimrangeT=dimW−(dimV−dimnullT)。
-
引理 3.6.11:T 是满的等价于 T′ 是单的。
证明:T 是满的当且仅当 rangeT=W,当且仅当 (rangeT)0={0},当且仅当 nullT′={0},当且仅当 T′ 是单的。
-
引理 3.6.12:设 V 和 W 都是有限维的,T∈L(V,W)。
-
dimrangeT′=dimrangeT。
证明:若 φ1,φ2∈L(W,F) 使得 φ1∘T≠φ2∘T,说明存在 v∈V 使得 (φ1∘T)(v)≠(φ2∘T)(v),说明存在 w∈rangeT 使得 φ1(w)≠φ2(w)。考虑 rangeT 的任意一组基 v1,⋯,vn 并将其扩充至 W 得到 v1,⋯,vn,w1,⋯,wm,那么上述条件等价于 φ1 和 φ2 给 v1,⋯,vn 设置的权重不同。
-
rangeT′=(nullT)0。
证明:设 nullT 的基为 w1,⋯,wm,扩充成为 V 的基得到 v1,⋯,vn,w1,⋯,wn,那么 Tv1,⋯,Tvn 就是 rangeT 的基。那么对于任意 φ∈L(W,F):
(φ∘T)(a1v1+⋯+anvn+b1w1+⋯+bmwm)=a1φ(Tv1)+⋯+anφ(Tvn)+φ(T(b1w1+⋯+bmwm))=a1φ(Tv1)+⋯+anφ(Tvn)
而 rangeT′ 就是相当于给 φ(Tv1),⋯,φ(Tvn) 任意设置权重所形成的所有线性泛函。
而注意到上式可以看成给 (φ∘T)v1,⋯,(φ∘T)vn 任意设置权重所形成的的所有线性泛函,那其实也就是 (nullT)0(注意为使 nullT 映到 0 则 w1,⋯,wn 的权重都应是 0,这也是吻合的)。
-
引理 3.6.13:设 V 和 W 都是有限维的,T∈L(V,W),则 T 是单的等价于 T′ 是满的。
证明:T 是单的,等价于 “若 V 的基是 v1,⋯,vn,则 rangeT 的基是 Tv1,⋯,Tvn”,而根据引理 3.6.12 证明的类似推法,给 Tv1,⋯,Tvn 设置权重等价于给 (φ∘T)v1,⋯,(φ∘T)vn 设置权重,所以等价于 V 的任意线性泛函都能取到,即 T′ 是满的。
//可以看出,原书作者对于对偶的理解已经很深入了,以致于不用每次像我都要重新用基的定义来解释一遍引理,而是直接有个明确的方向感推推式子就完了。换言之,每条引理在作者脑海中都已有一个简洁而直观的含义。但我目前还没找到正确的对于对偶的理解方式。
-
定义 3.6.14(转置):略。
-
引理 3.6.15:设 V 和 W 都是有限维的,T∈L(V,W),则 M(T′)=M(T)T。
证明:设 A=M(T),C=M(T′)。
实际上,由于 T′(φ)=φ∘T,所以 T′(φ) 可以理解为,给定 w1,⋯,wm 关于 φ 的权重以及 T:V→W,现在要反推出 v1,⋯,vn 的关于 (φ∘T) 的权重,这只需要做个代入即可:vi 的权重就是 φ(Tvi) 的值,而 φ(Tvi)=φ(A1,iw1+⋯+An,iwn)=A1,iφ(w1)+⋯+An,iφ(wn)。所以 Ci,j 处(即 wj 对 vi 的贡献)就应该填 Aj,i(即 vi 分解后 wj 处的系数)。那么 C=AT。
-
引理 3.6.16:在适应的定义下,矩阵 A,C 满足 (AC)T=CTAT。
结合引理 3.6.15 中所述的 M(T′) 的 “逆推” 含义,引理 3.6.16 应该是很直观的。
//事实上,由矩阵的角度,容易看出 (T′)′=T。但从对偶映射的角度来看好像并不是很显然。
-
定义 3.6.17(行秩和列秩):行秩就是矩阵的每一行对应的向量张成空间的维数,列秩就是矩阵的每一列对应的向量张成空间的维数。
-
引理 3.6.18:设 V 和 W 都是有限维的,T∈L(V,W),则 M(T) 的列秩等于 dimrangeT。
证明:M(T) 的每一列向量即 Tv1,⋯,Tvn,它们的张成空间就是 rangeT。
-
引理 3.6.19:设 A 为 m 行 n 列的矩阵,则 A 的行秩等于 A 的列秩。
证明:转为证明 A 的列秩等于 AT 的列秩,即 dimrangeT=dimrangeT′。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现