线性代数应该这样学5:线性映射的矩阵、可逆与同构。

在本系列中,我的个人见解将使用斜体标注。每篇文章的最后,我将选择摘录一些例题。由于文章是我独自整理的,缺乏审阅,难免出现错误,如有发现欢迎在评论区中指正。

Part 1:矩阵

本节终于进入到熟悉的矩阵,矩阵是线性映射的一种特殊表示,上一章的例题1已经说明了任何\(\mathbb{F}^n\to \mathbb{F}^m\)的线性映射都能够被\(m\times n\)个实数所确定。但事实上,用矩阵表示线性映射的方式并不是这么狭隘的。

矩阵(matrix)\(m\)\(n\)都是正整数,\(m\times n\)的矩阵\(A\)是由\(\mathbb{F}\)的元素构成的\(m\)\(n\)列数表。

\[A=\begin{pmatrix} A_{1,1} & \cdots & A_{1,n} \\ \vdots & & \vdots \\ A_{m,1} & \cdots & A_{m,n} \end{pmatrix}. \]

记号\(A_{j,k}\)表示位于\(A\)的第\(j\)行第\(k\)列的元素,第一个下标代表行,第二个下标代表列。

线性映射的矩阵(matrix of a linear map)\(T\in\mathcal L(V,W)\),并设\(v_1,\cdots,v_n\)\(V\)的基,\(w_1,\cdots,w_m\)\(W\)的基。规定\(T\)关于这些基的矩阵为\(m\times n\)矩阵\(\mathcal M(T)\),其中\(A_{j,k}\)满足

\[Tv_k=A_{1,k}w_k+\cdots+A_{m,k}w_m. \]

如果这些基不是上下文自明的,则记作\(\mathcal M(T,(v_1,\cdots,v_n),(w_1,\cdots,w_m))\)

矩阵只是一个数表,如果不与线性映射关联则矩阵没有任何意义。线性映射的矩阵是依赖于基的,而\(V,W\)中有无限组基,理论上任何一组基都能定义一个线性映射的矩阵,它们是互不相同的。因此,线性映射的矩阵必须要包含关于基的描述,否则将默认为自然基

为了方便记忆,最好将矩阵视为一堆列向量构成的表:

\[\mathcal M(T)=(Tv_1,\cdots,Tv_n). \]

其中每个\(Tv_k\)\(Tv_k\)\((w_1,\cdots,w_m)\)下的坐标,当然,这样的表述是不太严谨的。

\(\mathcal M(T)\)既可以看成是一个矩阵的代号,也可以把\(\mathcal M\)拆分出来,这时候\(\mathcal M\)应当被视为一个将线性映射映射到矩阵空间上的线性映射,即把线性映射\(T\)和矩阵\(\mathcal M(T)\)都视为各自线性空间的向量。

矩阵加法(matrix addition)与矩阵标量乘法(scalar multiplication of a matrix) 两个矩阵相加只适用于同型矩阵,将其对应元素相加;矩阵的标量乘法将其每个元素都乘以这个标量倍。

矩阵的线性运算是为了线性映射服务的,这样在同样的基表示下,线性映射的运算就有很简单的可视化表达

  • 在相同的基下,\(\mathcal M(S+T)=\mathcal M(S)+\mathcal M(T)\)
  • 在相同的基下,\(\mathcal M(\lambda T)=\lambda \mathcal M(T)\)

假设\(S,T\in\mathcal L(V,W)\)。如果取\((v_1,\cdots,v_n)\)\((w_1,\cdots,w_m)\)分别作为\(V,W\)的基,则

\[(S+T)v_k=Sv_k+Tv_k, \]

相当于\(\mathcal M(S+T)\)的第\(k\)列是\(Sv_k+Tv_k\),由线性映射的加性,结论容易证明。数乘由齐性同理。

\(\mathbb{F}^{m,n}\) \(\mathbb{F}^{m,n}\)代表所有\(m\times n\)矩阵构成的集合,结合矩阵加法和矩阵标量乘法的定义,它是一个线性空间,且\(\dim \mathbb{F}^{m,n}=mn\)

\(\mathbb{F}^{m,n}\)是线性空间的证明,只需定义加法单位元\(0\),它指的是所有元素都为\(0\)\(m\times n\)矩阵,然后加法和数乘在这个空间上的封闭性,是由数域\(\mathbb{F}\)的封闭性保证的。

为证\(\dim \mathbb{F}^{m,n}=mn\),只需找出其一组基,如果令\(e_{i,j}\)为第\(i\)行第\(j\)列为\(1\),其他元素为\(0\)的矩阵,则\(mn\)个这样的矩阵共同构成了\(\dim\mathbb{F}^{m,n}\)的基,它的张成性和线性无关性都很容易证明。

矩阵运算的本质全是线性映射的运算,所以矩阵乘法也应当如此定义。与映射的乘法一样,它依赖于三个空间,故依赖于三组基,接下来的定义使得在同样的基下,线性映射的矩阵乘法等价于映射的乘法

矩阵乘法(matrix multiplication)\(A\)\(m\times n\)矩阵,\(C\)\(n\times p\)矩阵,则\(AC\)定义为\(m\times p\)矩阵,其第\(j\)行第\(k\)列元素是

\[(AC)_{j,k} = \sum_{r=1}^{n}A_{j,r}C_{r,k}. \]

在这样的定义下,对于相同的基,\(\mathcal M(S)\mathcal M(T)=\mathcal M(ST)\)

\(\mathcal M(S)=A,\mathcal M(T)=C\),且\(T\in\mathcal L(U,V),S\in\mathcal L(V,W)\),其基分别是\(u_1,\cdots,u_p\)\(v_1,\cdots,v_n\)\(w_1,\cdots,w_m\),则

\[\begin{aligned} (ST)u_k&=S(Tu_k)\\ &=S\left(\sum_{r=1}^{n}C_{r,k}v_r \right)\\ &=\sum_{r=1}^n C_{r,k}Sv_r\\ &=\sum_{r=1}^n C_{r,k}\sum_{j=1}^m A_{j,r}w_j\\ &=\sum_{j=1}^m\left(\sum_{r=1}^n A_{j,r}C_{r,k} \right)w_j. \end{aligned} \]

结论得证。

由于\(ST\ne TS\),所以\(\mathcal M(ST)\ne \mathcal M(TS)\),也就是\(\mathcal M(S)\mathcal M(T)\ne \mathcal M(T)\mathcal M(S)\)

行矩阵和列矩阵\(A\)\(m\times n\)矩阵,对于\(1\le j\le m\)\(A_{j,\cdot}\)表示\(A\)的第\(j\)行组成的\(1\times n\)矩阵;\(A_{\cdot ,k}\)表示\(A\)的第\(k\)列组成的\(m\times 1\)矩阵。

行矩阵和列矩阵是矩阵分块的基础,它们能为矩阵的乘法运算提供很大的便利。为了应用行矩阵和列矩阵提供的便利,至少要知道行矩阵乘列矩阵等于一个数

  1. 矩阵乘积的元素等于行乘以列,即

    \[(AC)_{j,k}=A_{j,\cdot}C_{\cdot,k}. \]

  2. 矩阵乘积的列等于矩阵乘以列,即

    \[(AC)_{\cdot ,k}=AC_{\cdot ,k}. \]

  3. \(A\)\(m\times n\)矩阵,\(C\)\(n\times 1\)矩阵,则\(Ac\)可以看成\(A\)每一列的线性组合,系数是\(c\)的系数,即

    \[Ac=c_1A_{\cdot,1}+\cdots+c_nA_{\cdot ,n}. \]

这种表达方式将矩阵看成一堆列矩阵按行排列形成的矩阵,有时我们也称之为列向量。这样考虑的好处是,我们在线性映射的矩阵定义中,将每一列定义为\(Tv_k\)\(W\)的基下的系数,因此当\(W\)取自然基时,矩阵自然就是一堆列向量构成的列向量组。

Part 2:可逆

可逆(invertible)与逆(inverse) 线性映射\(T\in\mathcal L(V,W)\)称为可逆的,如果存在\(S\in\mathcal L(W,V)\)使得\(ST=I_V\)\(TS=I_W\),此时\(S\)称为\(T\)的逆。

注意\(S\)的原像空间和像空间和\(T\)是正好相反的

逆是唯一的 可逆的线性映射\(T\)必有唯一的逆,记作\(T^{-1}\)

\(T\in\mathcal L(V,W)\)\(S_1,S_2\)是它的逆,则

\[S_1=S_1(TS_2)=(S_1T)S_2=S_2. \]

可逆的等价条件 \(T\in\mathcal L(V,W)\)是可逆的等价于\(T\)既是单射又是满射。

这是一个非常重要的定理,给出了一种\(T\)不可逆的情形。同时,基于线性映射基本定理,对于可逆的\(T\in\mathcal L(V,W)\),必有

\[\dim V=\dim \mathrm{null}T+\dim\mathrm{range}T=\dim W. \]

所以如果一个线性映射的原像空间和像空间维数都不同,则必不可逆。

证明必要性。若\(T\)可逆,则

\[Tu=Tv\Rightarrow T^{-1}Tu=T^{-1}Tv\Rightarrow u=v, \]

这里证明\(T\)是单射。另外,\(\forall w\in W\),有

\[w=TT^{-1}w=T(T^{-1}w),\quad T^{-1}w\in V. \]

所以\(w\in\mathrm{range}T\),这里证明\(T\)是满射。

证明充分性。\(\forall w\in W\),存在\(v\in V\)使得\(Tv=w\)。定义一个映射\(S\),满足\(\forall w\in W\),如果\(Tv=w\),就有

\[Sw=v. \]

由于\(T\)是单射,所以每个\(w\)\(T\)下只有一个原像,因此这样的\(S\)是合理的。

下证明\(S\)是线性的(这一点很容易被遗忘),设\(w_1,w_2\in W\),则由\(S\)的定义方式,有

\[w_1+w_2=Tv_1+Tv_2=T(v_1+v_2),\\ S(w_1+w_2)=v_1+v_2=Sw_1+Sw_2; \]

这就验证了\(S\)的加性,齐性可以类似验证。

\(S\)的定义方式,显然有\(ST=I_V\)。而\(TSw=Tv=w\),说明\(TS=I_W\)。所以\(S=T^{-1}\)

以上证明的关键就在于构造出\(S\),但是这里写的比较简略,请读者自行扩充。同时,以上的二级补充说明对非线性的情况比较不友好,因此是一个比较粗糙的说明

以下是书上给出的两个研究无限维线性映射可逆性的例子,由此可以知道

  • 不是满的:\(\mathcal L(\mathcal P(\mathbb{R}),\mathcal P(\mathbb{R}))\)中的乘以\(x^2\)算子不满,所以不可逆。
  • 不是单的:\(\mathcal L(\mathbb{F}^{\infty},\mathbb{F}^\infty)\)中的向后移位算子不单,所以不可逆。

Part 3:同构的向量空间

同构(isomorphism) 同构指的是可逆的线性映射。

同构的(isomorphic)向量空间 若两个向量空间之间存在一个同构,则称这两个向量空间是同构的。

上一章中,揭示了对于有限维向量空间,可逆线性映射必定作用在维数相同的向量空间上。下面的定理加强一步,指出了同构存在与维数直接建立关系

同构向量空间与维数 \(\mathbb{F}\)上两个有限维向量空间同构,当且仅当其维数相同。

必要性已经证明了。

证明充分性只需要构造出这样的同构。设\(v_1,\cdots,v_n\)\(V\)的基,\(w_1,\cdots,w_n\)\(W\)的基,定义一个这样的映射:

\[T(c_1v_1+\cdots+v_nv_n)=c_1w_1+\cdots+c_nw_n. \]

容易证明\(T\in\mathcal L(V,W)\)。另外构造一个

\[S(c_1w_1+\cdots+c_nw_n)=c_1v_1+\cdots+c_nv_n, \]

则也容易证明\(S\in\mathcal L(W,V)\),并且\(ST=I_V\)\(TS=I_W\),这就构造了一个同构。

可以看到,这个证明与可逆的等价条件证明主要差距就在于是否是有限维的。当维数被限定,证明会变得简单

\(\mathcal L(V,W)\)\(\mathbb{F}^{m,n}\)同构\(\dim V=n,\dim W=m\),则\(\mathcal L(V,W)\)\(\mathbb{F}^{m,n}\)同构。

这个定理表明,如果给定了矩阵的基,则线性映射与其矩阵之间的关系是可逆的,给定一个矩阵也可以唯一地决定一个线性映射,也就是说:\(\mathcal M\in\mathcal L(\mathcal L(V,W),\mathbb{F}^{m,n})\)作为一个线性映射可逆。(这符号感觉套娃起来了)。

即证明\(\mathcal M\)可逆,也就是既单又满。

证明\(\mathcal M\)是单射,等价于证明\(\mathrm{null}\mathcal M=\{0\}\),这里\(\{0\}\)是零映射。设\(T\in\mathcal L(V,W)\),则\(\mathcal M(T)=0\)\(T\)在给定基下对应的是\(0\)矩阵,即所有\(V\)的基向量都被\(T\)映射到\(W\)中的\(0\)向量,自然\(T\)是一个零映射。(请读者自己理清上面这段话)

证明\(\mathcal M\)是满射,\(\forall A\in \mathbb{F}^{m,n}\),定义这样的一个\(T\in\mathcal L(V,W)\),其中

\[Tv_k=\sum_{j=1}^m A_{j,k}w_j, \]

\(\mathcal M(T)=A\),所以\(\mathcal M\)是满射。

由此结论直接可以得到:

\[\dim\mathcal L(V,W)=(\dim V)(\dim W). \]

向量的矩阵(matrix of a vector)\(v\in V\),并设\(v_1,\cdots,v_n\)\(V\)的基,则规定\(v\)关于这个基的矩阵是

\[\mathcal M(v)=\begin{pmatrix} c_1 \\ \vdots \\ c_n \end{pmatrix},\\ v=c_1v_1+\cdots+c_nv_n. \]

现在我们终于把向量与矩阵统一到了一起,注意我们都把向量视为列矩阵。实际上,\(\mathcal M(v)\)的各个元素就是\(v\)在基\((v_1,\cdots,v_n)\)下的坐标。以下结论都是成立的,如果从我们以前学过的角度来看,这些结论都很显然。

  • \(\mathcal M(T)_{\cdot ,k}=\mathcal M(Tv_k)\),即\(\mathcal M(T)\)的第\(k\)列就是\(Tv_k\)在基下的坐标,这一点就是我们的记忆方式。
  • \(\mathcal M(Tv)=\mathcal M(T)\mathcal M(v)\),即可以用矩阵乘法来表示线性映射,事实上我们在线性代数中一直是这样做的。

算子(operator) 向量空间到期自身的映射\(T\in\mathcal L(V,V)\)称为算子,将\(\mathcal L(V,V)\)记作\(\mathcal L(V)\)

对于算子,我们一般研究有限维向量空间。在有限维的情形,算子的单射与满射是等价的:设\(V\)有限维的\(T\in\mathcal L(V)\),则以下陈述等价:

  1. \(T\)可逆。
  2. \(T\)是单射。
  3. \(T\)是满射。

只需由线性映射基本定理:

\[\dim V=\dim \mathrm{null}T+\dim\mathrm{range}T, \]

注意到\(\mathrm{null}T\)\(\mathrm{range}T\)都是\(V\)的子空间即可。

例题

矩阵部分的例题,全都是老掉牙的构造线性映射,只要知道矩阵和线性映射之间的相互转换关系就没什么难的,这里全都不提了。关于3.D的习题,也大多是思维存在障碍,难度上可能不是很大,因为基本用书上的结论可以直接解决。

第一题(3.D 2)\(V\)是有限维的且\(\dim V>1\)。证明\(V\)上不可逆的算子构成的集合不是\(\mathcal L(V)\)的子空间。

证明某个集合不是向量空间,如果\(0\)元素在子空间内,则一般考虑构造一个不满足加法封闭性的案例。最简单的可逆算子显然是恒等算子

构造如下的\(T_1\)\(T_2\)

\[T_1v_1=v_2,\quad T_1v_2=v_2,\\ T_2v_1=v_1-v_2,\quad T_2v_2=0. \]

如果\(\dim V>2\),则在其他维度上是恒等的。此时\(T_1\)\(T_2\)都不是满射(可自行验证),但是

\[T_1+T_2=I_V. \]

第二题(3.D 9)\(V\)是有限维的,\(S,T\in\mathcal L(V)\)。证明\(ST\)可逆当且仅当\(S,T\)都可逆。

假设\(T\)不可逆,则\(T\)不是单射,存在\(v_1\)使得\(Tv_1=0\)。则\(STv_1=0\),故\(\mathrm{null}(ST)\ne \{0\}\)

假设\(S\)不可逆,则\(S\)不是满射,\(\exists w\in V\)使得不存在\(v\)\(Sv=w\),那么\(\forall D\in\mathcal L(V)\)必有\(STDw\ne w\),即任何\(D\)都不是\(ST\)的逆。

第三题(3.D 16)\(V\)是有限维的,\(T\in\mathcal L(V)\)。证明:\(T=\lambda I_V\)当且仅当对每个\(S\in\mathcal L(V)\)都有\(ST=TS\)

这题比看上去要难,原本我认为应当使用反证法,但是答案却给出了正向证明的方式。其思路就在于,如果\(T=\lambda I_V\),则对任何\(v\)\(v\)\(Tv\)线性相关

必要性是显然的。

下证充分性。已知\(ST=TS,\forall S\in\mathcal L(V)\),先证明\(v\)\(Tv\)必是线性相关的,如果不然,则\(v,Tv\)可以被扩充成一组基:\(v,Tv,u_1,\cdots,u_n\),定义这样的\(S\in\mathcal L(V)\),使得

\[S(av+bTv+c_1u_1+\cdots+c_nu_n)=bv, \]

\(STv=v\)\(Sv=0\),由\(ST=TS\)得到

\[STv=v=TSv=0, \]

这与\(v,Tv\)线性无关矛盾,所以\(v,Tv\)必然是线性相关的,这样就存在一个与\(v\)相关的\(a_v\),使得

\[Tv=a_vv, \]

下证\(a_v\)\(v\)无关,找到另外一个\(w\in V\setminus\{0\}\),有\(Tw=a_ww\),下证\(a_v=a_w\)

\(v,w\)线性相关时,有\(v=bw\),则

\[a_vv=Tv=bTw=ba_ww=a_wv, \]

所以\(a_v=a_w\)

\(v,w\)线性无关时,有

\[a_{v+w}(v+w)=T(v+w)=Tv+Tw=a_vv+a_ww, \]

移项就得到

\[a_v=a_{v+w}=a_w. \]

这说明\(a_v\)\(v\)无关,故必有\(Tv=av\),即\(T=aI_V\)

第四题(3.D 17)\(V\)是有限维的,且\(\mathcal E\)\(\mathcal L(V)\)的子空间使得\(\forall S\in \mathcal L(V)\)\(T\in\mathcal E\),都有\(ST\in\mathcal E\)\(TS\in\mathcal E\)。证明\(\mathcal E=\{0\}\)\(\mathcal E=\mathcal L(V)\)

这题要从\(\mathcal L(V)\)的结构入手,注意到\(\mathcal L(V)\)是一个\(n^2\)维的线性空间。我想,从矩阵角度来做会不会更清晰一些

必要性是显然的,下证充分性。

\(e_1,\cdots,e_n\)\(V\)的一个基,每一个线性映射\(T\)对应的矩阵为\(\mathcal M(T)\)\(\mathcal E\)中线性映射对应的矩阵构成的集合是\(\mathcal M(\mathcal E)\)

\(T\in\mathcal E,T\ne 0\),则\(T\)对应的矩阵至少含有一个\(0\)元素,不妨设\(\mathcal M(T)_{j,k}\ne 0\)

\(\Delta _{a,b}\)指的是第\(a\)行第\(b\)列为\(1\),其它元素为\(0\)的矩阵,则由于\(\Delta_{a,j}\in\mathbb{F}^{n,n}\)

\[\Delta_{a,j}\mathcal M(T)=\Delta_{a,k}, \]

所以\(\Delta_{1,k},\cdots,\Delta_{n,k}\in\mathcal M(\mathcal E)\)。对每一个\(a\),由于\(\Delta_{k,b}\in\mathbb{F}^{n,n}\)

\[\Delta_{a,k}\Delta_{k,b}=\Delta_{a,b}, \]

所以\(\Delta_{a,b}\in\mathbb{F}^{n,n}\)。在证明过程中,\(a=1,\cdots,n\)\(b=1,\cdots,n\),这就证明了\(\mathcal M(\mathcal E)=\mathbb{F}^{n,n}\)

由于\(\mathcal L(V)\)\(\mathbb{F}^{n,n}\)同构,所以将每一个矩阵看成线性映射,就能有相同的结论,即\(\mathcal E=\mathcal L(V)\)

posted @ 2021-02-03 01:16  江景景景页  阅读(4227)  评论(0编辑  收藏  举报