第十章 多线性代数和行列式
\(\newcommand{\L}{\mathcal L}\newcommand{\M}{\mathcal M}\newcommand{\span}{\operatorname{span}}\newcommand{\null}{\operatorname{null}}\newcommand{\range}{\operatorname{range}}\newcommand{\tr}{\operatorname{tr}}\newcommand{\sym}{\operatorname{sym}}\newcommand{\alt}{\operatorname{alt}}\newcommand{\sign}{\operatorname{sign}}\newcommand{\perm}{\operatorname{perm}}\newcommand{\B}{\mathcal B}\newcommand{\o}{\otimes}\newcommand{\l}{\langle}\newcommand{\r}{\rangle}\newcommand{\lv}{\lVert}\newcommand{\rv}{\rVert}\)
本章将延续上一章的记号和假设。
10.1 双线性型和二次型
-
定义 10.1.1(双线性型):\(V\) 上的一个双线性型是一个函数 \(\beta:V\times V\to\mathbb F\) 满足对任意 \(u\in V\),由 \(v\mapsto \beta(v,u)\) 和由 \(v\mapsto\beta(u,v)\) 定义的 \(V\) 上的函数均是线性映射。
-
定义 10.1.2(\(V^{(2)}\)):\(V\) 上的所有双线性型构成向量空间,记为 \(V^{(2)}\)。
-
定义 10.1.3(双线性型的矩阵):设 \(\beta\in V^{(2)}\),\(e_1,\cdots,e_n\) 是 \(V\) 的一组基。定义 \(\beta\) 关于这组基的矩阵为 \(\M(\beta,(e_1,\cdots,e_n))\),满足 \(\M(\beta,(e_1,\cdots,e_n))_{i,j}=\beta(e_i,e_j)\)。
-
引理 10.1.4:设 \(e_1,\cdots,e_n\) 是 \(V\) 的一组基。那么由 \(\beta\mapsto\M(\beta,(e_1,\cdots,e_n))\) 定义的映射是 \(V^{(2)}\) 到 \(\mathbb F^{n\times n}\) 的可逆映射。从而 \(\dim V^{(2)}=(\dim V)^2\)。
-
引理 10.1.5:设 \(\beta\in V^{(2)}\),\(T\in\L(V)\)。那么双线性型 \((u,v)\mapsto\beta(u,Tv)\) 的矩阵为 \(\M(\beta)\M(T)\),双线性型 \((u,v)\mapsto \beta(Tu,v)\) 的矩阵为 \(\M(T)^\mathsf T\M(\beta)\)。
引理 10.1.5 揭示了,双线性型和线性变换的复合,也可以用它们对应的矩阵相乘来表示,这某种程度上和线性变换之间的复合是一致的。
-
引理 10.1.6:设 \(\beta\in V^{(2)}\),\(e_1,\cdots,e_n\) 和 \(f_1,\cdots,f_n\) 是 \(V\) 的一组基,\(P=\M(I,(e_1,\cdots,e_n),(f_1,\cdots,f_n))\),那么 \(\M(\beta,(e_1,\cdots,e_n))=P^\mathsf T\M(\beta,(f_1,\cdots,f_n))P\)。
证明:也可以把 \(P\) 理解为由 \(Tf_i:=e_i\) 定义的线性变换 \(T\) 的矩阵 \(\M(T,(f_1,\cdots,f_n))\),然后再利用引理 10.1.5 即可。
-
定义 10.1.7(对称双线性型):称 \(\rho\in V^{(2)}\) 是交换的,当且仅当 \(\rho(u,v)=\rho(v,u)\) 对任意 \(u,v\in V\) 成立。
\(V^{(2)}\) 中所有对称双线性型构成 \(V^{(2)}\) 的子空间,记为 \(V^{(2)}_{\sym}\)。
-
定义 10.1.8(对称矩阵):略。
-
定理 10.1.9:设 \(\rho\in V^{(2)}\)。那么下列条件等价:
- \(\rho\) 是对称的。
- \(\rho\) 关于 \(V\) 的任意一组基的矩阵是对称的。
- \(\rho\) 关于 \(V\) 的某一组基的矩阵是对称的。
- \(\rho\) 关于 \(V\) 的某一组基有对角矩阵。
证明:1->4:发现对于固定的 \(v\),由 \(u\mapsto \rho(v,u)\) 定义的 \(V\to\mathbb F\) 映射是从 \(n\) 维到 \(1\) 维的线性泛函,所以其零空间的维度至少为 \(n-1\)。也即,任选 \(v\in V\),一定存在一个 \(n-1\) 维的空间 \(W\) 使得 \(V=\span\{v\}\oplus W\) 且 \(\rho(v,w)=0\) 对任意 \(w\in W\) 成立。然后就可以归纳了。
-
定理 10.1.10:设 \(V\) 是实内积空间,\(\rho\in V^{(2)}_{\sym}\)。那么 \(\rho\) 关于 \(V\) 的一组标准正交基有对角矩阵。
证明:实际上是定理 7.2.5。
-
定义 10.1.11(交错双线性型):称 \(\alpha\in V^{(2)}\) 是交错的,当且仅当 \(\alpha(v,v)=0\) 对任意 \(v\in V\) 成立。
\(V^{(2)}\) 中所有交错双线性型构成 \(V^{(2)}\) 的子空间,记为 \(V^{(2)}_{\alt}\)。
-
定理 10.1.12:设 \(\alpha\in V^{(2)}_{\alt}\)。那么 \(\alpha(u,v)=-\alpha(v,u)\) 对任意 \(u,v\in V\) 成立。
证明:若 \(u,v\) 线性相关,那么由双线性型的线性性和交错双线性型的定义易证;
若 \(u,v\) 线性无关,那么 \(0=\alpha(u+v,u+v)=\alpha(u,v)+\alpha(v,u)\)。
//暂时还不知道是否能直接将 “交错” 替换为 “反对称” 一词,因为有些反对称矩阵的定义是 \(B^*=-B\),也即 \(\langle u,v\rangle=-\overline{\langle v,u\rangle}\)。
-
定理 10.1.13:\(V^{(2)}=V^{(2)}_{\sym}\oplus V^{(2)}_{\alt}\)。
证明:设 \(\beta\in V^{(2)}\)。容易验证由 \(\rho(u,v):=\frac{\beta(u,v)+\beta(v,u)}{2}\) 定义的双线性型 \(\rho\) 是对称的,由 \(\alpha:=\frac{\beta(u,v)-\beta(v,u)}{2}\) 定义的双线性型 \(\alpha\) 是交错的,且 \(\beta=\rho+\alpha\)。同时容易验证 \(V^{(2)}_{\sym} \cap V^{(2)}_{\alt}=\{0\}\)。
-
定义 10.1.14(二次型):对于 \(\beta\in V^{(2)}\),由 \(q_{\beta}(v):=\beta(v,v)\) 定义函数 \(q_\beta:V\to\mathbb F\)。
称一个函数 \(q:V\to\mathbb F\) 是 \(V\) 上的二次型,当且仅当存在 \(\beta\in V^{(2)}\) 使得 \(q=q_\beta\)。
-
引理 10.1.15:设 \(q:V\to\mathbb F\)。那么下列条件等价:
- \(q\) 是二次型。
- 存在唯一的 \(\beta\in V^{(2)}_{\sym}\) 使得 \(q=q_\beta\)。
- \(q(\lambda v)=\lambda^2 q(v)\) 对任意 \(\lambda\in\mathbb F,v\in V\) 成立,且由 \((u,v)\mapsto q(u+v)-q(u)-q(v)\) 定义的函数是 \(V\) 上的对称双线性型。
- \(q(2v)=4q(v)\) 对任意 \(v\in V\) 成立,且由 \((u,v)\mapsto q(u+v)-q(u)-q(v)\) 定义的函数是 \(V\) 上的对称双线性型。
证明:1->2:存在性是将 \(q\) 对应的 \(\beta\) 由定理 10.1.13 分解到 \(V^{(2)}_{\sym}\) 上;唯一性是因为 \(\beta(u,v)=\beta(v,u)=\frac{q(u+v)-q(u)-q(v)}{2}\) 被唯一确定了。
2->3,2->4,3->4:显然。
4->1:设 \(\beta=\frac{q(u+v)-q(u)-q(v)}{2}\),则 \(\beta\in V^{(2)}_{\sym}\) 且容易验证 \(\beta(u,u)=q(u)\)。
-
定理 10.1.16:设 \(q\) 是 \(V\) 上的二次型。那么:
- 存在 \(V\) 的一组基 \(e_1,\cdots,e_n\) 和 \(\lambda_1,\cdots,\lambda_n\in\mathbb F\) 使得 \(q(x_1e_1+\cdots+x_ne_n)=\lambda_1 x_1^2+\cdots+\lambda_n x_n^2\) 对任意 \(x_1,\cdots,x_n\in\mathbb F\) 成立。
- 若 \(V\) 是实内积空间,那么 1 中的基底可以被选为正交基。
证明:定理 10.1.9.4 和定理 10.1.10 的直接推论。
10.2 交错多线性型
-
定义 10.2.1(\(V^m\)):略。
-
定义 10.2.2(多线性型):设 \(m\) 是正整数。\(V\) 上的一个 \(m\) 重线性型是一个函数 \(\beta:V^m\to\mathbb F\),满足对任意的 \(1\leq k\leq m\) 和 \(u_1,\cdots,u_{k-1},u_{k+1},\cdots,u_m\in V\),由 \(v\mapsto \beta(u_1,\cdots,u_{k-1},v,u_{k+1},\cdots,u_m)\) 定义的函数均是线性映射。
\(V\) 上的所有 \(m\) 重线性型构成向量空间,记为 \(V^{(m)}\)。
称一个函数 \(\beta\) 是 \(V\) 上的多线性型,当且仅当存在正整数 \(m\) 使得 \(\beta\) 是 \(V\) 上的 \(m\) 重线性型。
-
定义 10.2.3(交错多线性型):设 \(m\) 是正整数。称 \(\alpha\in V^{(m)}\) 是交错的,当且仅当 \(\alpha(v_1,\cdots,v_m)=0\) 对任意有重复元素的 \(v_1,\cdots,v_m\in V\) 成立。
\(V^{(m)}\) 中所有交错多线性型构成 \(V^{(m)}\) 的子空间,记为 \(V^{(m)}_{\alt}\)。
-
引理 10.2.4:设 \(m\) 是正整数,\(\alpha\in V^{(m)}_{\alt}\),\(v_1,\cdots,v_m\) 是 \(V\) 的一个线性相关组。那么 \(\alpha(v_1,\cdots,v_m)=0\)。
-
推论 10.2.5:设 \(m>n\) 是正整数,则 \(V^{(m)}_{\alt}=\{0\}\)。
-
引理 10.2.6:设 \(m\) 是正整数,\(\alpha\in V^{(m)}_{\alt}\),\(v_1,\cdots,v_m\in V\),\(1\leq i<j\leq m\),那么 \(\alpha(v_1,\cdots,v_i,\cdots,v_j,\cdots,v_m)=-\alpha(v_1,\cdots,v_j,\cdots,v_i,\cdots,v_m)\)。
-
定义 10.2.7(排列,\(\perm\)):略。
-
定义 10.2.8(排列的符号,\(\sign\)):略。
-
引理 10.2.9:交换排列的两个元素,排列的符号乘上 \(-1\)。
-
引理 10.2.10:设 \(m\) 是正整数,\(\alpha\in V^{(m)}_{\alt}\),\(v_1,\cdots,v_m\in V\),\(p \in \perm m\),那么 \(\alpha(v_{p_1},\cdots,v_{p_m})=\sign(p_1,\cdots,p_m)\alpha(v_1,\cdots,v_m)\)。
-
定理 10.2.11:设 \(e_1,\cdots,e_n\) 是 \(V\) 的一组基,\(v_1,\cdots,v_n\in V\),\(B=\M(I,(e_1,\cdots,e_n),(v_1,\cdots,v_n))\),\(\alpha\in V^{(n)}_{\alt}\)。那么 \(\alpha(v_1,\cdots,v_n)=\alpha(e_1,\cdots,e_n)\sum_{p\in \perm n}\sign(p_1,\cdots,p_n)B_{p_1,1}\cdots B_{p_n,n}\)。
-
定理 10.2.12:\(\dim V^{(n)}_{\alt}=1\)。
证明:由 \(\alpha\mapsto \alpha(e_1,\cdots,e_n)\) 定义的函数 \(V^{(n)}_{\alt}\to\mathbb F\) 是可逆映射。
-
引理 10.2.13:设 \(\alpha\in V^{(n)}_{\alt}\land \alpha\neq 0\),\(e_1,\cdots,e_n\in V\),那么 \(\alpha(e_1,\cdots,e_n)\neq 0\) 当且仅当 \(e_1,\cdots,e_n\) 线性无关。
证明:引理 10.2.4 说明了当 \(e_1,\cdots,e_n\) 线性相关时的情况。而当 \(e_1,\cdots,e_n\) 线性无关时,它们构成 \(V\) 的一组基,结合定理 10.2.11 和 \(\alpha\neq 0\) 可知一定有 \(\alpha(e_1,\cdots,e_n)\neq 0\)。
10.3 行列式
- 定义 10.3.1(\(\alpha_T\)):设 \(m\) 是正整数,\(T\in\L(V)\)。对于 \(\alpha\in V^{(m)}_{\alt}\),由 \(\alpha_T(v_1,\cdots,v_m):=\alpha(Tv_1,\cdots,Tv_m)\) 定义 \(\alpha_T\in V^{(m)}_{\alt}\)。
容易验证由 \(\alpha\mapsto\alpha_T\) 定义的映射是线性映射,但由 \(T\mapsto \alpha_T\) 的映射不是线性映射,从而不能简单地把 \(\alpha_T\) 理解为 \(\alpha\) 和 \(T\) 的复合。
-
定义 10.3.2(行列式):设 \(T\in\L(V)\)。存在唯一的 \(\lambda\in\mathbb F\) 满足 \(\alpha_T=\lambda\alpha\) 对任意 \(\alpha\in V^{(n)}_{\alt}\) 成立,将 \(\lambda\) 记为 \(T\) 的行列式 \(\det T\)。
证明:\(\dim V_{\alt}^{(n)}=1\),而由 \(\alpha\mapsto\alpha_{T}\) 定义的映射是 \(V_{\alt}^{(n)}\) 上的线性映射。
由定理 10.2.12 知,存在唯一的 \(\alpha\in V^{(n)}_{\alt}\) 使得 \(\alpha(e_1,\cdots,e_n)=1\),那么 \(\det T=\alpha_T(e_1,\cdots,e_n)/\alpha(e_1,\cdots,e_n)=\alpha(Te_1,\cdots,Te_n)\)。
-
定义 10.3.3(矩阵的行列式):设 \(A\in\mathbb F^{\mathbb Z_{1..n}\times \mathbb Z_{1..n}}\)。存在唯一的 \(T\in\L(\mathbb F^n)\) 使得 \(T\) 关于 \(\mathbb F^n\) 的标准基的矩阵为 \(A\)。定义 \(A\) 的行列式为 \(\det A:=\det T\)。
-
引理 10.3.4:\(\det:(\mathbb F^n)^n\to \mathbb F\) 是 \(\mathbb F^n\) 上的 \(n\) 重交错多线性型。
证明:设 \(e_1,\cdots,e_n\) 是 \(\mathbb F^n\) 的标准基,\(T\in\L(\mathbb F^n)\) 满足 \(T\) 关于 \(e_1,\cdots,e_n\) 的矩阵为 \((v_1,\cdots,v_n)\)。根据定理 10.2.12,存在唯一的 \(\alpha\in (\mathbb F^n)^{(n)}_{\alt}\) 使得 \(\alpha(e_1,\cdots,e_n)=1\)。那么 \(\det(v_1,\cdots,v_n)=\det T=\alpha_T(e_1,\cdots,e_n)/\alpha(e_1,\cdots,e_n)=\alpha(Te_1,\cdots,Te_n)=\alpha(v_1,\cdots,v_n)\)。
-
引理 10.3.5:设 \(A\in\mathbb F^{\mathbb Z_{1..n}\times \mathbb Z_{1..n}}\)。那么 \(\det A=\sum_{p\in \perm n}\sign(p_1,\cdots,p_n)A_{p_1,1}\cdots A_{p_n,n}\)。
-
推论 10.3.6:设 \(A\in\mathbb F^{\mathbb Z_{1..n}\times \mathbb Z_{1..n}}\) 是上三角矩阵,对角线元素分别为 \(\lambda_1,\cdots,\lambda_n\)。那么 \(\det A=\lambda_1\cdots\lambda_n\)。
-
引理 10.3.7:
- 设 \(S,T\in\L(V)\)。那么 \(\det(ST)=\det S\det T\)。
- 设 \(A,B\in\mathbb F^{\mathbb Z_{1..n}\times \mathbb Z_{1..n}}\)。那么 \(\det (AB)=\det A\det B\)。
证明:1:\(\alpha_{ST}=(\det S)\alpha_T=(\det S\det T)\alpha\)。
2:结合 1 由矩阵的行列式的定义立即可得。
-
引理 10.3.8:设 \(T\in\L(V)\)。那么:
- \(T\) 可逆当且仅当 \(\det T\neq 0\)。
- 若 \(T\) 可逆,则 \(\det T^{-1}=\frac{1}{\det T}\)。
证明:联合引理 10.2.13 和引理 10.3.7 可知。
-
推论 10.3.9:设 \(T\in\L(V)\),\(\lambda\in\mathbb F\)。那么 \(\lambda\) 是 \(T\) 的本征值当且仅当 \(\det(\lambda I-T)= 0\)。
-
引理 10.3.10:设 \(T\in\L(V)\),\(S\in\L(W,V)\) 是可逆的。那么 \(\det(S^{-1}TS)=\det T\)。
证明:设 \(\tau\in W^{(n)}_{\alt}\),设 \(\alpha\in V^{(n)}_{\alt}\) 满足 \(\alpha(v_1,\cdots,v_n)=\tau(S^{-1}v_1,\cdots,S^{-1}v_n)\)。那么对任意 \(w_1,\cdots,w_n\in W\),\(\tau_{S^{-1}TS}(w_1,\cdots,w_n)=\alpha_T(Sw_1,\cdots,Sw_n)=(\det T)\alpha(Sw_1,\cdots,Sw_n)=(\det T)\tau(w_1,\cdots,w_n)\)。
引理 10.3.10 也可以利用矩阵证明。
-
定理 10.3.11:设 \(T\in\L(V)\),\(e_1,\cdots,e_n\) 是 \(V\) 的基,那么 \(\det T=\det \M(T,(e_1,\cdots,e_n))\)。
证明:设 \(f_1,\cdots,f_n\) 是 \(\mathbb F^n\) 的标准基。设 \(S\in\L(\mathbb F^n,V)\) 满足 \(Sf_i=e_i\) 对任意 \(1\leq i\leq n\) 成立。那么 \(\det T=\det S^{-1}TS=\det\M(S^{-1}TS,(f_1,\cdots,f_n))=\det \M(T,(e_1,\cdots,e_n))\)。
-
定理 10.3.12:设 \(\mathbb F=\mathbb C\),\(T\in\L(V)\)。那么 \(\det T\) 等于 \(T\) 的所有特征值计重数的乘积。
-
引理 10.3.13:
- 设 \(A\in\mathbb F^{\mathbb Z_{1..n}\times \mathbb Z_{1..n}}\),那么 \(\det A^\mathsf T=\det A\)。
- 设 \(T\in\L(V)\),那么 \(\det T'=\det T\)。
- 设 \(V\) 是内积空间,\(T\in\L(V)\),那么 \(\det T^*=\overline{\det T}\)。
证明:引理 10.3.5。
-
引理 10.3.14:设 \(V\) 是内积空间,\(S\in\L(V)\) 是等距同构,那么 \(|\det S|=1\)。
证明:\(1=\det I=\det S^*S=\det S^*\det S=\overline{\det S}\det S=|\det S|^2\)。
-
引理 10.3.15:设 \(V\) 是内积空间,\(T\in\L(V)\) 是正算子,那么 \(\det T\geq 0\)。
证明:结合引理 7.3.3.2、引理 7.2.5 和推论 10.3.6 可知。
-
定理 10.3.16:设 \(V\) 是内积空间,\(T\in\L(V)\)。那么 \(|\det T|\) 等于 \(T\) 的所有奇异值计重数的乘积。
证明:\(|\det T|=\sqrt{\det T^*T}\),而 \(T^*T\) 是正算子,本征值是 \(T\) 的所有奇异值平方的结果。
-
定理 10.3.17:设 \(T\in\L(V)\),\(q\) 是 \(T\) 的特征多项式。那么 \(q(z)=\det(zI-T)\) 对任意 \(z\in\mathbb F\) 成立。
证明:若 \(\mathbb F=\mathbb C\)(定义 8.3.1),根据定理 8.2.7 取出一组基,将 \(zI-T\) 在这组基上表示为矩阵即证。
若 \(\mathbb F=\mathbb R\)(定义 9.1.12),设 \(e_1,\cdots,e_n\) 是 \(V\) 的一组基,\(\det(zI-T)=\det\M(zI-T,(e_1,\cdots,e_n))=\det\M((zI-T)_\mathbb C,(e_1,\cdots,e_n))=\det (zI-T)_\mathbb C=\det (zI_\mathbb C-T_\mathbb C)=q(z)\)。
-
引理 10.3.18:设 \(T\in\L(V)\)。那么 \(T\) 的特征多项式可以被写为 \(z^n-(\tr T)z^{n-1}+\cdots+(-1)^n(\det T)\)。
证明:若 \(\mathbb F=\mathbb C\),直接根据定义 8.3.1 展开即可。若 \(\mathbb F=\mathbb R\),\(T\) 的特征多项式就是 \(T_\C\) 的特征多项式,且 \(\tr T=\tr T_\C\),\(\det T=\det T_\C\)。
-
引理 10.3.19:设 \(v_1,\cdots,v_n\in \mathbb F^n\),那么 \(|\det (v_1,\cdots,v_n)|\leq\prod_{i=1}^n\lVert v_i\rVert\)。
证明:QR 分解。
10.4 张量积
本节中,假设 \(W\) 是有限维的且 \(W\neq \{0\}\),\(\dim W=m\)。
-
定义 10.4.1(双线性泛函):\(V\times W\) 上的一个双线性泛函是一个函数 \(\beta:V\times W\to\mathbb F\),满足:对任意 \(w\in W\),由 \(v\mapsto \beta(v,w)\) 定义的 \(V\) 上的函数是线性映射;对任意 \(v\in V\),由 \(w\mapsto \beta(v,w)\) 定义的 \(W\) 上的函数也是线性映射。
\(V\times W\) 上的所有双线性泛函构成向量空间,记为 \(\mathcal B(V,W)\)。
-
引理 10.4.2:\(\dim\B(V,W)=\dim V\dim W\)。
-
定义 10.4.3(张量积):定义 \(V\) 和 \(W\) 的张量积为 \(V\otimes W:=\B(V',W')\)。
定义 \(v\in V\) 和 \(w\in W\) 的张量积为由 \((v\otimes w)(\varphi,\tau)=\varphi(v)\tau(w)\) 定义的函数 \(v\otimes w\in V\otimes W\)。
这里的定义可能并不太好理解,接下来提供一种新视角。
定义 \(V\) 和 \(V'\) 之间的组合为函数 \(h:V\times V'\to\mathbb F\) 满足 \((v,f)_V:=f(v)\)。\(h\) 其实是一个双线性泛函,从而从某种意义上说明了 \(V\) 和 \(V'\) 的地位其实是对称的。不过这里 \((\cdot,f)_V\in V'\)(其实就是 \(f\)),\((v,\cdot)_V\in V''\)。但这里有一个 \(V\) 到 \(V''\) 的自然线性同构:\(v\mapsto (v,\cdot)_V\) 。
那么考虑 \(f\in V'\) 和 \(g\in W'\) 的张量积,应当是由 \((f\otimes g)((v,\cdot)_V,(w,\cdot)_W)\mapsto (v,f)_V(w,g)_W\) 定义的函数 \(f\o g\in \B(V'',W'')\),将其自然同构,就可以看成 \(f\o g\in \B(V,W)\) 满足 \((f\o g)(v,w)\mapsto f(v)g(w)\)。这种从 \(V\) 上的线性泛函和 \(W\) 上的线性泛函相乘得到 \(V\times W\) 上的双线性泛函的定义方法就显得自然很多。
回到 \(v\in V\) 和 \(w\in W\) 的向量积,其实可以看成是 \(V'\) 上的线性泛函 \((v,\cdot)_V\in V''\) 和 \(W'\) 上的线性泛函 \((w,\cdot)_W\in W''\) 自然相乘得到的结果,\((v,\cdot)(w,\cdot)\) 是 \(V'\times W'\) 上的双线性泛函。
-
引理 10.4.4:\(\dim V\otimes W=\dim V\dim W\)。
-
引理 10.4.5:设 \(v,v_1,v_2\in V\),\(w,w_1,w_2\in W\),\(\lambda\in\mathbb F\)。那么:
- \((v_1+v_2)\otimes w=v_1\otimes w+v_2\otimes w\)。
- \(v\otimes(w_1+w_2)=v\o w_1+v\o w_2\)。
- \(\lambda(v\o w)=(\lambda v)\o w=v\o (\lambda w)\)。
-
引理 10.4.6:
-
若 \(e_1,\cdots,e_p\in V\) 线性无关且 \(f_1,\cdots,f_q\in W\) 线性无关,那么 \(\{e_i\o f_j:1\leq i\leq p\land 1\leq j\leq q\}\) 也线性无关。
证明:仿照对偶基的定义,设 \(\varphi_1,\cdots,\varphi_p\in V'\) 是 \(e_1,\cdots,e_p\) 的对偶线性泛函,\(\tau_1,\cdots,\tau_q\in W'\) 是 \(f_1,\cdots,f_q\) 的对偶线性泛函。那么 \((e_i\o f_j)(\varphi_k,\tau_l)=[i=k\land j=l]\)。
-
若 \(e_1,\cdots,e_n\) 是 \(V\) 的基,\(f_1,\cdots,f_m\) 是 \(W\) 的基,那么 \(\{e_i\o f_j:1\leq i\leq n\land 1\leq j\leq m\}\) 是 \(V\o W\) 的基。
-
也可以从另一种视角理解:设 \(\varphi_1,\cdots,\varphi_n\) 是 \(V'\) 的基,\(\tau_1,\cdots,\tau_q\in W'\) 是 \(W'\) 的基,那么 \(\varphi_i\tau_j\) 的含义是提取 \(v\) 的第 \(i\) 维坐标和 \(w\) 的第 \(j\) 维坐标的乘积,所以 \(\{\varphi_i\o \tau_j\}\) 构成 \(\B(V,W)\) 的基。
注意,引理 10.4.6 并不说明 \(\{v\o w:v\in V,w\in W\}=V\o W\):任选 \(V\) 的一组基 \(e_1,\cdots,e_n\)(对偶基为 \(\varphi_1,\cdots,\varphi_n\))和 \(W\) 的一组基 \(f_1,\cdots,f_m\)(对偶基为 \(\tau_1,\cdots,\tau_n\)),那么 \((v\o w)(\varphi_i,\tau_j)=\varphi_i(v)\tau_j(w)\),从而所有 \(v\o w\) 形成的矩阵恰好是所有秩小于等于 \(1\) 的矩阵。
也可以从另一种视角理解:对 \(f\in V'\) 和 \(g\in W'\),\((f\o g)(\sum_i a_iv_i,\sum_j b_jw_j)=f(\sum_i a_iv_i)g(\sum_j b_jw_j)=\sum_i\sum_j f(v_i)g(w_j)a_ib_j\),所以 \((f\o g)\) 对应在基 \(\{\varphi_i\tau_j\}_{i,j}\) 上的矩阵是 \((f(v_i)g(w_j))_{i,j}\),只是一个秩小于等于 \(1\) 的矩阵。
-
定义 10.4.7(双线性映射):从 \(V\times W\) 到一个向量空间 \(U\) 的一个双线性映射是一个函数 \(\Gamma:V\times W\to U\),满足:对任意 \(w\in W\),由 \(v\mapsto \Gamma(v,w)\) 定义的 \(V\) 上的函数是线性映射;对任意 \(v\in V\),由 \(w\mapsto \Gamma(v,w)\) 定义的 \(W\) 上的函数也是线性映射。
\(V\times W\) 到 \(U\) 的所有双线性映射构成向量空间。
容易发现,由 \((v,w)\mapsto v\o w\) 定义的 \(V\times W\to V\o W\) 的函数是双线性映射。双线性映射的性质和线性映射的性质有所不同,特别值得注意的是,双线性映射的原空间和值域并不同构,而且如果设该双线性映射对应的矩阵为 \((u_{i,j})_{i,j}\),其值域也并非 \(\{\sum_{i,j} a_{i,j}u_{i,j}\}\) 而是 \(\{\sum_{i,j} a_ib_ju_{i,j}\}\)。
-
引理 10.4.8:设 \(U\) 是一个向量空间。那么:
- 设 \(\Gamma:V\times W\to U\) 是双线性映射。那么存在唯一的线性映射 \(\hat\Gamma:V\o W\to U\) 使得 \(\hat\Gamma(v\o w)=\Gamma(v,w)\) 对任意 \(v\in V,w\in W\) 成立。
- 设 \(T:V\o W\to U\) 是线性映射。那么存在唯一的双线性映射 \(T^\#:V\times W\to U\) 使得 \(T^\#(v,w)=T(v\o w)\) 对任意 \(v\in V,w\in W\) 成立。
证明:任取 \(V\) 的一组基 \(e_1,\cdots,e_n\) 和 \(W\) 的一组基 \(w_1,\cdots,w_m\)。\(V\times W\to U\) 的双线性映射由其在每个 \((e_i,f_j)\) 处的值唯一确定,\(V\o W\to U\) 的线性映射(或者其在每个 \(v\o w\) 处的取值)由其在每个 \(e_i\o f_j\) 处的值唯一确定。只要这些值相等,就有
\[\Gamma(\sum a_ie_i,\sum b_jf_j)=\sum_i\sum_ja_ib_j\Gamma(e_i,f_j)=\sum_i\sum_j a_ib_jT(e_i\o f_j)=T(\sum_i\sum_ja_ib_j(e_i\o f_j))=T((\sum a_ie_i)\o(\sum b_jf_j)) \]或者说,双线性映射的实质就是,从 \((a_i)_i\) 和 \((b_j)_j\) 构造出矩阵 \((a_ib_j)_{i,j}\)(求 \(v\o w\)),再把它和 \(\Gamma\) 的表示矩阵点积(作用 \(T\))。
引理 10.4.8 说明了,从 \(V\times W\) 到 \(U\) 的所有双线性映射构成的向量空间,同构于,从 \(V\o W\) 到 \(U\) 的所有线性映射构成的向量空间。它们的维数是 \(\dim V\dim W\dim U\)。
-
定义 10.4.9(\(V\o W\) 上的内积):设 \(V,W\) 都是内积空间。存在唯一的 \(V\o W\) 上的内积满足 \(\l v\o w,u\o x\r=\l v,u\r\l w,x\r\) 对任意 \(v,u\in V\) 和 \(w,x\in W\) 成立,将其定义为 \(V\o W\) 上的内积。
证明:设 \(\{e_i\},\{f_j\}\) 分别是 \(V,W\) 的标准正交基,那么 \(V\o W\) 上的内积实际上被定义为:\(\l (\sum a_ie_i)\o(\sum b_jf_j),(\sum c_ie_i)\o(\sum d_jf_j)\r=\l \sum a_ib_j(e_i\o f_j),\sum c_id_j(e_i\o f_j)\r\)
-
引理 10.4.10:设 \(V,W\) 都是内积空间,\(e_1,\cdots,e_n\) 是 \(V\) 的标准正交基,\(f_1,\cdots,f_m\) 是 \(W\) 的标准正交基。那么 \(\{e_i\o f_j:1\leq i\leq n\land 1\leq j\leq m\}\) 是 \(V\o W\) 的标准正交基。
我们还可以将双线性泛函、张量积和双线性映射扩展到多重线性空间上,但由于得到的结果和二重的情况大致相同,所以不写了。