从向量空间到特征多项式(参考自代数学引论)

抽象线性空间

定义线性空间 \((R,V)\),满足:

\(R\) 是域,\(V\) 是加法交换群;

给定运算 \((R,V)\to V\),即“纯量乘向量”,需要满足:对加法的左分配律(纯量加法和向量加法)和结合律(具体来说是 \(a(b{\bf x})=(ab){\bf x}\))和“酉性”(\(1{\bf x}={\bf x}\))。

容易定义线性组合。定义一个子集 \(S\subset V\),满足 \(RS=S,S\)\(V\) 的加法子群。那么称所有 \(S\) 中元素的线性组合为 \(\lang S\rang\),容易验证是线性空间,称为 \(S\) 的线性包络。

线性无关:如果向量组 \(V=\{{\bf v_{1:s}}\}\) 不存在这样的 \(\alpha_{1:s}\in R\),使得 \(\sum v_i\alpha_i={\bf 0}\),则称此向量组线性

\({\bf e_{1:s}}\) 线性无关,且能被 \({\bf v_{1:t}}\) 线性表出,那么:\(s\le t\)

证明:设

\[{\bf e_{i}}=\sum _{j=1}^t\alpha_{ij}{\bf v_{j}}\\ \sum_{i=1}^s x_i{\bf e_{i}}=\sum_{i=1}^sx_i\sum _{j=1}^t\alpha_{ij}{\bf v_{j}}\\ =\sum _{j=1}^t{\bf v_{j}}\sum_{i=1}^sx_i\alpha_{ij} \]

考虑方程组:

\[\sum_{i=1}^sx_i\alpha_{ij}=0,\forall 1\le j\le t \]

如果 \(s>t\),那么 \(x_i\) 必有非平凡解。此时,

\[\sum_{i=1}^s x_i{\bf e_{i}}=0 \]

矛盾。

推论:两个等价的线性无关向量组大小相等(两个向量组等价当且仅当任意向量都可以被另外一个组的向量线性表出)。

定义向量组的秩是其任意极大线性无关部分组的大小。

定义线性空间 \(V\) 的维数 \(\dim V=n\) 是极大线性无关向量组的大小,基是任意一组大小 \(=n\) 的线性无关向量组。

那么有定理:

1.任意向量可以被基唯一地线性表出。我们邀请读者把证明当作一个练习

2(替换定理).对于线性无关向量组 \({\bf v_{1:s}}\) 满足 \(s<n\),可以把它扩充到一个基。

考虑一组基 \({\bf e_{1:n}}\):选出最大的 \(k\) 和指标 \(i_{1:k}\)\(\{{\bf f_{1:s}},{\bf e_{i_{1:k}}}\}\) 线性无关。此时对于所有 \(\bf e_j\)\(\bf e_j\) 均可被 \(\{{\bf f_{1:s}},{\bf e_{i_{1:k}}}\}\) 线性表出(否则与最大矛盾),从而任何向量可以被此向量组线性表出,而极大线性向量组就是基。

给定一组基,定义一个向量 \(\bf v\) 的坐标 \(X\) 是用基线性组合的系数向量。

如果基产生了变化,把新基的每个向量用原基线性表出,得到矩阵 \(A\)。此时,\(X'=AX\) 即是新坐标。

此变换显然是可逆的,因此有 \(X=A^{-1}X'\)

两个(定义在同一基础域的)线性空间同构,当且仅当存在双射 \(f\),使得:

\[f(a{\bf u}+b{\bf v})=af({\bf u})+bf({\bf v}) \]

易见维数是同构不变的。我们指出,只有维数是同构不变的:容易发现向量到坐标是双射(在一个确定基下),所以设 \(n=\dim V\)\(R^n\simeq (R,V)\)

定义线性子空间的和:\(V+W=\{{\bf v}+{\bf w}\mid {\bf v}\in V,{\bf w}\in W\}\) 和交。易见此二者都是线性空间。

有:

\[\dim V+\dim W-\dim V\cap W=\dim V+W \]

证明:设 \(a=\dim V,b=\dim W,c=\dim V\cap W\)

考虑 \(V\cap W\) 的基 \(e_{1:c}\),加上 \(v_{1:a-c}\)\(V\) 的基,加上 \(w_{1:b-c}\)\(W\) 的基。

容易验证 \(\lang e_{1:c},v_{1:a-c},w_{1:b-c}\rang\) 可以线性表出 \(V+W\)。因此,只需证明 \(e_{1:c},v_{1:a-c},w_{1:b-c}\) 线性无关。

\[\sum \alpha_ie_i+\sum \beta_iv_i=\sum \gamma_iw_i \]

\(\alpha,\beta,\gamma\) 不全为 \(0\)

那么 \(LHS\in V,RHS\in W\),故 \(LHS,RHS\in V\cap W\)。那么有:

\[\sum \theta_ie_i=\sum \gamma_iw_i \]

\(\gamma\) 必定全为 \(0\),同样对于 \(\beta\) 成立。此时 \(\alpha\) 也必定全为 \(0\),矛盾。

证毕。

此公式导出有趣的结果:二维空间的直线交必定是点,三维空间中平面的交必定是直线,四维空间中三维立方体的交必定是平面(要求不平行,即 \(V+W\neq V\))。

定义线性子空间的和 \(\sum V_i\) 是直和,当且仅当对于所有 \(u\in \sum V_i\)

\[u=\sum u_i,u_i\in V_i \]

的分解唯一。

\(\sum V_i\) 是直和,当且仅当:\(\forall i,V_i\cap \sum_{i\neq j} V_j=\bf 0\)

引理:所有 \(u\) 满足分解唯一等价于 \(\bf 0\) 的分解 \(\bf 0=0+0+\dots +0\) 唯一。

我们邀请读者把证明当作一个习题

证明:

充分性:若分解唯一,则设 \({\bf x}=V_i\cap \sum_{i\neq j} V_j\)。则应该有:\({\bf x}=\sum_{j\neq i} {\bf u_j}\)

\[{\bf 0=0+0+\dots +0}\\ ={-\bf x}+\sum_{j\neq i} {\bf u_j} \]

根据分解唯一,有 \(\bf x=0\)。证毕。

必要性:

\[{\bf 0}=\sum_{i} \bf {a_i} \]

那么有 \({\bf a_i}=\sum _{i\neq j}{\bf a_j}\in V_i\cap \sum_{i\neq j}V_j={\bf 0}\),即 \(\bf a_i=0\)。所以此分解唯一。

根据上面的维数的定理,此条件等价于

\[\sum \dim V_i=V \]

同样,容易证明,对于 \(U\subset V\)\(\exists W\subset V\),使得

\[U\oplus W=V,\dim W=\dim V-\dim U \]

线性映射(线性变换)

把同构的双射要求去掉,就可以得到一般意义的线性映射 \(f:U\to V\)。不难验证,所有线性映射 \(f\) 的集合 \(\mathcal L(U,V)\) 构成线性空间。

容易发现,\(Im f,\ker f\)\(V,U\) 的子空间。

有:\(\dim f(U)\le \dim U\)。这是容易证明的。

我们发现,这样的线性映射可以被看做给定两组基后的矩阵。

定义 \(\operatorname{rank} f=\dim Im f\)。也是对应矩阵 \(M_f\) 的秩(容易说明)。而矩阵的乘法也是线性映射的复合。

根据上面的不等式,容易证明:\(\dim Im (f\circ g)\le \min(\dim Im f,\dim Im g)\)(矩阵中已经知道)

\(f:V\to W\),有:

\[\dim Im f+\dim \ker f=\dim V \]

我们知道矩阵的结论,现在我们再次证明之。

考虑 \(\ker f=\lang e_{1:k}\rang\),现扩充至 \(\lang e_{1:n}\rang\),是 \(V\) 的基。

因为

\[f(\sum_{i=1}^n a_ie_i)=f(\sum_{i=1}^k a_ie_i)+f(\sum_{i=k+1}^n a_ie_i)\\ =f(\sum_{i=k+1}^n a_ie_i) \]

因此 \(e_{k+1:n}\) 可以线性表出 \(Im f\),只需证明其线性无关。

如果 \(\sum_{i>k} b_ie_i=0\),那么应该有:

\[\sum _{i=k+1}^nb_ie_i\in \ker f=\sum_{i=1}^k a_ie_i \]

所以 \(b_{k+1:n}=0\),证毕。

线性算子

\(\mathcal L(U)=\mathcal L(U,U)\) 线性空间的向量是线性算子(或线性变换)。一切之前的语言都可以沿用过来。

有一个之后会用到的特殊线性算子 \(\mathcal P\):设 \(U=V\oplus W\)\(\bf x\) 的分解是 \(\bf x=x_u+x_v\),那么 \(\mathcal P\bf x=x_u\)。容易发现,有 \(\mathcal P^2=\mathcal P\)

极小多项式 \(\mu_{\mathcal A}(t)\) 是次数最小的首一多项式使得 \(\mu_{\mathcal A}(\mathcal A)=\mathcal O\)

\[\mu_{\mathcal A}(t)=t^m+\mu_1 t^{m-1}+\mu_2t^{m-2}+\dots+\mu_m \]

容易发现,\(\mu_m\neq 0\) 当且仅当 \(\mathcal A\) 可逆,并且极小多项式整除所有零化多项式。

线性算子和矩阵不是完全一致的,具体来说,矩阵还需要在意基底。考察 \(\mathcal A\) 算子在基底 \(\bf e\) 下的作用:

\[\mathcal A {\bf e_i}=\sum _k a_{ki}\bf e_k \]

在另一个基底就不是这样(由于这是算子)

\[\mathcal A {\bf e'_i}=\sum _k a'_{ki}\bf e'_k \]

如果设 \(B\) 矩阵把 \(\bf e\) 转化为了 \(\bf e'\),那么也有算子 \(\mathcal B \bf e_j=e'_j\)。这样的算子 \(\mathcal B\) 一定是可逆的。

再定义一个辅助算子 \(\mathcal A'\),满足:

\[\mathcal A'{\bf e_j}=\sum _ia_{ij}'\bf e_i \]

那么应该有:

\[\mathcal B^{-1}\mathcal A\mathcal B{\bf e_j}=\mathcal A'\bf e_j \]

在同一基底下,\(A'=B^{-1}AB\)

此时,我们得到了转换矩阵的公式,并称 \(A,A'\) 是相似的。我们有时需要计算矩阵的方幂:如果 \(\mathcal A\) 的特征根是 \(\lambda\),那么就有 \(A'=Diag(\lambda_i)\sim A\)。我们把特征列向量(线性无关) \(\bf v_i\) 排成矩阵 \({[\bf v_1,v_2\dots v_n}]=B\),就有 \(BA'=AB\)。这样的操作也叫相似对角化。

特征向量、不变子空间

\(V=\bigoplus W_i\),那么:

\[{\bf x=x_1+x_2+\dots +x_m,x_i}\in W_i \]

所以 \(\mathcal P_i\mapsto \bf x\to x_i\) 就满足

\[\sum _i\mathcal P_i=\mathcal E\ \ \ \ \ \ \ \ (1) \]

并且有 \(\mathcal P_i\mathcal P_j=\mathcal O ,\mathcal P_i^2=\mathcal P_i\),如果 \(i\neq j\)。(2)

\[W_i=\mathcal P_i V,K_i=\ker \mathcal P_i \]

\(\mathcal P_i\) 就是 \(V\)\(W_i\) 上沿着 \(K_i\) 的投影。

我们指出这些结论对于投影来说是充分的。即满足上述 \((1)(2)\) 的线性映射集合 \(\{\mathcal P_i\}\) 满足:

\[V=\bigoplus W_i \]

其中 \(W_i=Im \mathcal P_i\)

根据条件,可以找到 \(\bf x_1,x_2\dots x_m\),使得

\[{\bf x}=\mathcal P_j({\bf x_j})=\sum_{i\neq j}\mathcal P_i({\bf x_i}) \]

作用 \(\mathcal P_j\) 有:

\[{\bf x}=\mathcal P_j({\bf x_j})=\mathcal P_j^2({\bf x_j})=\sum_{i\neq j}\mathcal P_j\mathcal P_i({\bf x_i})=\bf 0 \]

根据前面直和的判定,这样就证明了这是直和。

如果子空间 \(U\subset V\) 满足 \(\mathcal A U\subset U\),称 \(U\)\(\mathcal A\) 的不变子空间。

容易验证,在某个基底下,矩阵 \(A\) 取分块矩阵 \(diag(A_U,A_W)\) 的形式,当且仅当, \(U,W\) 是两个对于线性算子 \(\mathcal A\) 的不变子空间的直和。

也不难验证,对于多项式 \(f\)\(f(U)\) 也是不变子空间。

一维不变子空间的任何非零向量都被称为 \(\mathcal A\) 的特征向量。如果 \(\bf x\)\(\mathcal A\) 的特征向量:

\[\mathcal A{\bf x}=\lambda \bf x \]

则称 \(\lambda \in R\) 是一个特征值。

此时也会有 \(f(\mathcal A){\bf x}=f(\lambda) {\bf x},\forall f\in R[t]\)

\(V^\lambda\) 是所有特征向量的子空间。\(\dim V^\lambda\) 称为特征值 \(\lambda\) 的几何重数。

特征向量一定满足 \((\mathcal A-\lambda \mathcal E)\bf x=0\),而 \(\bf x\neq 0\)

那么:\(\ker (\mathcal A-\lambda \mathcal E)\neq \bf 0\),即 \(\det(A-\lambda E)=0\)

\(\lambda\) 当成变元,记为 \(t\),计算其 \(\det (tE-A)=(-1)^n \det (A-tE)\) 就得到了特征多项式 \(\chi_{\mathcal A}(t)\)

容易验证,特征多项式在相似作用下不变,因此,我们也可以谈论一个线性算子的特征多项式。

特征值就是特征多项式的根。根据代数基本定理有一个简单的推论:复向量空间的线性算子一定有特征向量。

我们把 \(\lambda\) 在特征多项式的根的重数记作特征值 \(\lambda\) 的代数重数。显然,几何重数不超过代数重数。

\(\mathcal A\) 可对角化的充要条件是:所有 \(\chi_{\mathcal A}(t)\) 的根都在 \(R\) 中,并且每个特征值 \(\lambda\) 的几何重数都等于代数重数。

我们把证明留给读者当作一个习题。

哈密顿-卡莱定理

1.线性算子的矩阵可以在相似意义下化为三角形式。

我们把证明留给读者当作一个习题。

2.线性算子零化自己的多项式。

我们把证明留给读者当作一个习题。

posted @ 2024-04-08 20:47  British_Union  阅读(56)  评论(2编辑  收藏  举报