【学习笔记】线性代数_线性变换

5.1 线性变换的定义、性质与运算

5.1.2 线性变换的定义

定义 5.2

线性空间 \(_FV\) 中有 \(T: V\to V\) 满足：

\(T (\alpha+\beta)=T (\alpha)+T (\beta)\)
\(T (k\alpha)=kT (\alpha)\)

称 \(T\) 为线性变换

一些常见的线性变换：

\(T_\theta\) ，二维平面上逆时针旋转 \(\theta\)
\(D\)，\(P[x]_n\) 上的多项式求导
\(\Pi_x\)，\(R^3\) 在 \(x\) 平面上的投影
\(T_0\)，零变换
\(T_g\)，恒等变换

5.1.3 线性变换的性质

\(T (0)=0,T (-\alpha)=-T (\alpha)\)

\[\left(\sum_{i=1}^nk_i\alpha_i\right)=\sum_{i=1}^nk_iT(\alpha_i) \]

线性相关的向量组经过线性变换后依然线性相关

5.1.4 线性变换的运算

记 \(L (V)\) 为全体线性变换所成的集合，有以下运算

加法

\((T_1+T_2)(\alpha)=T_1 (\alpha)+T_2 (\alpha)\)
数量乘法

\((kT)(\alpha)=k[T (\alpha)]\)
乘法

\((T_1 T_2)(\alpha)=T_1[T_2 (\alpha)]\)

可以发现 \(L (V)\) 构成 \(P\) 上的一个线性空间
逆变换

设 \(T\in L (V)\)，若存在 \(S\in L (V)\) 使得

\(ST=TS=T_g\)

称 \(S\) 为 \(T\) 的逆变换，记为 \(T^{-1}\)，说 \(T\) 是可逆的
方幂

\(T^k=T\cdot T^{k-1}\)

\(T^0=T_g\)

5.2 线性变换的矩阵

5.2.1 线性变换的矩阵表示

定义 5.3

设 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是线性空间 \(V\) 的一个基，\(T\) 是 \(V\) 的一个线性变换，基的像可以表示为

\[\begin{aligned} T(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n)&=[T(\varepsilon_1),T(\varepsilon_2),\cdots,T(\varepsilon_n)]\\ &=[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n] \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\\ \end{bmatrix} \\ &=[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n]A \end{aligned} \]

定理 5.1

对一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)，\(\exists\) 唯一的线性变换 \(T\) 使得 \(T (\varepsilon_i)=\alpha_i (i\in[n])\)

由此定理可以得到，\(T\) 和 \(A\) 一一对应，\(A\) 称为 \(T\) 在基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 下的矩阵，同时该矩阵其实就是两组基之间的过渡矩阵

定理 5.2

线性变换的运算和其对应矩阵的运算等价

定理 5.3

在相同基下，若 \(T\) 在该基下的矩阵为 \(A\)，\(\xi\) 对应坐标为 \(X=[x_1, x_2,\cdots, x_n]^T\)，\(T (\xi)\) 对应坐标为 \(Y=[y_1, y_2,\cdots, y_n]^T\)，有

\[Y=AX \]

5.2.2 线性变换在不同基下的矩阵间的关系

定理 5.4

设 \(T\) 在两组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 和 \(\eta_1,\eta_2,\cdots,\eta_n\) 下的矩阵为 \(A, B\)，且前者到后者的过渡矩阵为 \(M\)，则

\[MB=AM,B=M^{-1}AM \]

定义 5.4

若存在 \(P\) 使得 \(B=P^{-1}AP\)，称 \(A\) 相似于 \(B\)，记作 \(A\sim B\)

可以发现其满足反身性，对称性，传递性

定理 5.5

两个 \(n\) 阶相似方阵可以看作同一个线性变换在不同基下的矩阵

5.3 特征值与特征向量

5.3.1 特征值与特征向量的概念

定义 5.5

\(T\) 为 \(_FV\) 上的一个线性变换，若 \(\exists\lambda_0\in F,\alpha\in V,\alpha\neq 0\) 使得 \(T (\alpha)=\lambda_0\alpha\)，称 \(\lambda_0\) 是 \(T\) 的特征值，\(\alpha\) 为 \(T\) 的属于特征值 \(\lambda_0\) 的特征向量

定义 5.6

\(V_{\lambda_0}=\{\alpha\in V|T (\alpha)=\lambda_0\alpha\}\) 是一个 \(V\) 的子空间，称为特征子空间

5.3.2 特征值与特征向量的求法

任取一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)，\(T (\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n)=(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) A\)

有特征向量 \(\lambda\) 满足 \(AX=\lambda X\) 有非零解

因此 \((\lambda E-A) X=0\) 有非零解，于是 \(|\lambda E-A|=0\)

定义 5.7

\(|\lambda E-A|\) 称为 \(A\) 的特征多项式，是一个在数域 \(P\) 上的多项式，记为 \(f (\lambda)=|\lambda E-A|\), 其根称为 \(A\) 的特征根（特征值）

特征值代入 \(\lambda\) 可以得到 \(A\) 的属于 \(\lambda_0\) 的特征向量

补充概念：

特征值 \(\lambda_i\) 的代数重数和几何重数

代数重数：特征方程的某一个根的重根数，形式化地说，若 \(f (\lambda)=\prod\limits_{i=1}^k (\lambda-\lambda_i)^{r_i}\)，则 \(\lambda_i\) 的代数重数就是 \(r_i\)
几何重数：\((\lambda_i E-A) X=0\) 的基础解系的向量个数

有：几何重数 \(\le\) 代数重数

同时有如下结论：

在复数域上，\(A\) 总有特征值，但是在其他数域上不一定
若 \(A\) 的特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)，\(A^2\) 的特征值为 \(\lambda_1^2,\lambda_2^2,\cdots,\lambda_n^2\)，\(\lambda_0 E+A\) 的特征值为 \(\lambda_0+\lambda_1,\lambda_0+\lambda_2,\cdots,\lambda_0+\lambda_n\)

（可根据定义证明）
\(\lim\limits_{\lambda_0\to 0}|\lambda_0 E-A|=|A|\)，利用该性质可以用可逆矩阵逼近不可逆矩阵，以使不可逆矩阵获得可逆矩阵的一些性质，以下是一个例子：

\(A=(a_{ij})_{n\times n}, B=(b_{ij})_{n\times n}\)，证明 \((AB)^*=B^*A^*, A^*=\operatorname{adj}(A)\)（伴随矩阵）

证：当 \(A, B\) 为可逆矩阵，有 \((AB)^*=|AB|(AB)^{-1}=|A||B|B^{-1}A^{-1}=|B|B^{-1}|A|A^{-1}=B^*A^*\)

\(A, B\) 不都可逆时

\[\begin{aligned} \big((\lambda_0E+A)(\lambda_0E+B)\big)^*&=(\lambda_0 E+B)^*(\lambda_0 E+A)^*\\ \lim_{\lambda\to0}\big((\lambda E+A)(\lambda E+B)\big)^*&=\lim_{\lambda\to0}\big((\lambda E+B)^*(\lambda E+A)^*\big)\\ &=\lim_{\lambda\to0}(\lambda E+B)^*\lim_{\lambda\to 0}(\lambda E+A)^*\\ (AB)^*&=B^*A^* \end{aligned} \]

定理 5.6

相似矩阵具有相同的特征多项式，特征值、特征向量和取定的基无关

5.3.3 特征多项式的基本性质

\[f(\lambda)=|\lambda E-A|=\lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^n|A| \]

可知：

在复数域上，若 \(f (\lambda)=\prod\limits_{i=1}^n (\lambda-\lambda_i)\)，则 \(\prod\limits_{i=1}^n\lambda_i=|A|,\sum\limits_{i=1}^n\lambda_i=\operatorname{tr}(A)\)

定理 5.7（\(\text{Hamilton-Cayley}\) 定理）

设 \(A\) 是 \(P\) 上的一个 \(n\) 阶方阵，\(f(\lambda)=|\lambda E-A|\) 是 \(A\) 的特征多项式，则

\[f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E =0 \]

利用此性质可以将任意一个关于 \(A\) 的多项式化简为不超过 \(n-1\) 次的多项式。

证明见 Hamilton-Cayley 定理

注意，此处的 \(f(A)\) 不能简单认为是 \(|A E-A|\)，实际上，

\[f(A)= \left| \begin{bmatrix} A&O&\cdots&O\\ O&A&\cdots&O\\ \cdots&\cdots&\cdots&\cdots\\ O&O&\cdots&A\\ \end{bmatrix} - \begin{bmatrix} a_{11}E&a_{12}E&\cdots&a_{1n}E\\ a_{21}E&a_{22}E&\cdots&a_{2n}E\\ \cdots&\cdots&\cdots&\cdots\\ a_{n1}E&a_{n2}E&\cdots&a_{nn}E\\ \end{bmatrix} \right| \]

5.3.4 特征向量的线性无关性

定理 5.8

属于不同特征值的特征向量是线性无关的

有以下推论：

定理 5.9

对 \(A\) 的不同特征值 \(\lambda_1,\lambda_2,\cdots,\lambda_k\)，若 \(X_{i1},X_{i2},\cdots,X_{ir_i}(i\in[k])\) 是属于特征值 \(\lambda_i(i\in[k])\) 的线性无关的特征向量组，则向量组

\[X_{11},X_{12},\cdots,X_{1r_1},X_{21},X_{22},\cdots,X_{2r_2},\cdots,X_{k1},X_{k2},\cdots,X_{kr_k} \]

是线性无关的，证明见特征向量线性的无关性

5.4 矩阵的对角化

定理 5.10

\(n\) 阶矩阵 \(A\) 与对角阵相似 \(\Longleftrightarrow\) \(A\) 有 \(n\) 个线性无关的特征向量

给出一个构造性的证明

设 \(B=\operatorname{diag}[\lambda_1,\lambda_2,\cdots,\lambda_n]\sim A\)，则 \(\exists P\) 使得 \(B=P^{-1}AP\)

可以发现，

\[\begin{aligned} PB&=AP\\ [X_1,X_2,\cdots,X_n]\operatorname{diag}[\lambda_1,\lambda_2,\cdots,\lambda_n]&=A[X_1,X_2\cdots,X_n]\\ [\lambda_1X_1,\lambda_2X_2,\cdots,\lambda_nX_n]&=[AX_1,AX_2,\cdots,AX_n] \end{aligned} \]

从而 \(\lambda_iX_i=AX_i\) ，从而 \(X_i\) 是 \(A\) 的特征向量，又 \(P\) 可逆，于是有 \(A\) 有 \(n\) 个特征向量 \(X_1,X_2,\cdots,X_n\)

推论

一个 \(n\) 阶方阵 \(A\)，如果它有 \(n\) 个不同的特征值，则 \(A\) 一定可以对角化

5.5 化对称矩阵为对角阵

实对称矩阵都可以被化为对角阵

定理 5.11

实对称阵的特征多项式的根都是实数，证明见定理 5.11

定理 5.12

实对称矩阵属于不同特征值的特征向量是正交的，证明见定理 5.12

定理 5.13

实对称阵一定正交相似于一个对角阵，证明见定理 5.13

下面给出一种构造方案：

求出 \(A\) 的特征根 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)
求出每个特征根 \(\lambda_1\) 对应的基础解系 \(\varepsilon_{i1},\varepsilon_{i2},\cdots,\varepsilon_{ir_i}\)，并作施密特正交化，单位化
一共 \(n\) 个向量将其拼接得到 \(P\) 即可

5.6 正交变换

定义 5.8

正交变换是保持内积的线性变换，即 \(\forall \alpha,\beta\) 有 \((T(\alpha),T(\beta))=(\alpha,\beta)\)

事实上，这等价于保持长度的线性变换

定理 5.14

\(T\) 是 \(n\) 维度欧式空间的一个线性变换，如下四个命题等价：

\(T\) 是正交变换
\(\forall\alpha\in V,\Vert T(\alpha)\Vert=\Vert\alpha\Vert\)
若 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是标准正交基，则 \(T(\varepsilon_1),T(\varepsilon_2),\cdots,T(\varepsilon_n)\) 也是标准正交基
\(T\) 在任意一个标准正交基下的矩阵是正交矩阵

由第四条，我们知道正交变换的矩阵 \(A\) 是正交矩阵，因此有 \(|A|=\pm1\)

我们称 \(|A|=1\) 的正交变换为第一类正交变换，\(|A|=-1\) 的为第二类正交变换

比如，\(T_\theta\) 是第一类，按照 \(x\) 轴反射变换是第二类

posted @ 2025-01-14 00:36 思考人生中… 阅读(450) 评论(0) 收藏举报

刷新页面返回顶部

思考人生中… 的博客