【学习笔记】线性代数_线性变换
5.1 线性变换的定义、性质与运算
5.1.2 线性变换的定义
定义 5.2
线性空间 \(_FV\) 中有 \(T: V\to V\) 满足:
- \(T (\alpha+\beta)=T (\alpha)+T (\beta)\)
- \(T (k\alpha)=kT (\alpha)\)
称 \(T\) 为线性变换
一些常见的线性变换:
- \(T_\theta\) ,二维平面上逆时针旋转 \(\theta\)
- \(D\),\(P[x]_n\) 上的多项式求导
- \(\Pi_x\),\(R^3\) 在 \(x\) 平面上的投影
- \(T_0\),零变换
- \(T_g\),恒等变换
5.1.3 线性变换的性质
- \(T (0)=0,T (-\alpha)=-T (\alpha)\)
- 线性相关的向量组经过线性变换后依然线性相关
5.1.4 线性变换的运算
记 \(L (V)\) 为全体线性变换所成的集合,有以下运算
-
加法
\((T_1+T_2)(\alpha)=T_1 (\alpha)+T_2 (\alpha)\)
-
数量乘法
\((kT)(\alpha)=k[T (\alpha)]\)
-
乘法
\((T_1 T_2)(\alpha)=T_1[T_2 (\alpha)]\)
可以发现 \(L (V)\) 构成 \(P\) 上的一个线性空间
-
逆变换
设 \(T\in L (V)\),若存在 \(S\in L (V)\) 使得
\(ST=TS=T_g\)
称 \(S\) 为 \(T\) 的逆变换,记为 \(T^{-1}\),说 \(T\) 是可逆的
-
方幂
\(T^k=T\cdot T^{k-1}\)
\(T^0=T_g\)
5.2 线性变换的矩阵
5.2.1 线性变换的矩阵表示
定义 5.3
设 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是线性空间 \(V\) 的一个基,\(T\) 是 \(V\) 的一个线性变换,基的像可以表示为
定理 5.1
对一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\),\(\exists\) 唯一的线性变换 \(T\) 使得 \(T (\varepsilon_i)=\alpha_i (i\in[n])\)
由此定理可以得到,\(T\) 和 \(A\) 一一对应,\(A\) 称为 \(T\) 在基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 下的矩阵,同时该矩阵其实就是两组基之间的过渡矩阵
定理 5.2
线性变换的运算和其对应矩阵的运算等价
定理 5.3
在相同基下,若 \(T\) 在该基下的矩阵为 \(A\),\(\xi\) 对应坐标为 \(X=[x_1, x_2,\cdots, x_n]^T\),\(T (\xi)\) 对应坐标为 \(Y=[y_1, y_2,\cdots, y_n]^T\),有
5.2.2 线性变换在不同基下的矩阵间的关系
定理 5.4
设 \(T\) 在两组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 和 \(\eta_1,\eta_2,\cdots,\eta_n\) 下的矩阵为 \(A, B\),且前者到后者的过渡矩阵为 \(M\),则
定义 5.4
若存在 \(P\) 使得 \(B=P^{-1}AP\),称 \(A\) 相似于 \(B\),记作 \(A\sim B\)
可以发现其满足反身性,对称性,传递性
定理 5.5
两个 \(n\) 阶相似方阵可以看作同一个线性变换在不同基下的矩阵
5.3 特征值与特征向量
5.3.1 特征值与特征向量的概念
定义 5.5
\(T\) 为 \(_FV\) 上的一个线性变换,若 \(\exists\lambda_0\in F,\alpha\in V,\alpha\neq 0\) 使得 \(T (\alpha)=\lambda_0\alpha\),称 \(\lambda_0\) 是 \(T\) 的特征值,\(\alpha\) 为 \(T\) 的属于特征值 \(\lambda_0\) 的特征向量
定义 5.6
\(V_{\lambda_0}=\{\alpha\in V|T (\alpha)=\lambda_0\alpha\}\) 是一个 \(V\) 的子空间,称为特征子空间
5.3.2 特征值与特征向量的求法
任取一组基 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\),\(T (\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n)=(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) A\)
有特征向量 \(\lambda\) 满足 \(AX=\lambda X\) 有非零解
因此 \((\lambda E-A) X=0\) 有非零解,于是 \(|\lambda E-A|=0\)
定义 5.7
\(|\lambda E-A|\) 称为 \(A\) 的特征多项式,是一个在数域 \(P\) 上的多项式,记为 \(f (\lambda)=|\lambda E-A|\), 其根称为 \(A\) 的特征根(特征值)
特征值代入 \(\lambda\) 可以得到 \(A\) 的属于 \(\lambda_0\) 的特征向量
补充概念:
特征值 \(\lambda_i\) 的代数重数和几何重数
-
代数重数:特征方程的某一个根的重根数,形式化地说,若 \(f (\lambda)=\prod\limits_{i=1}^k (\lambda-\lambda_i)^{r_i}\),则 \(\lambda_i\) 的代数重数就是 \(r_i\)
-
几何重数:\((\lambda_i E-A) X=0\) 的基础解系的向量个数
有:几何重数 \(\le\) 代数重数
同时有如下结论:
-
在复数域上,\(A\) 总有特征值,但是在其他数域上不一定
-
若 \(A\) 的特征值为 \(\lambda_1,\lambda_2,\cdots,\lambda_n\),\(A^2\) 的特征值为 \(\lambda_1^2,\lambda_2^2,\cdots,\lambda_n^2\),\(\lambda_0 E+A\) 的特征值为 \(\lambda_0+\lambda_1,\lambda_0+\lambda_2,\cdots,\lambda_0+\lambda_n\)
(可根据定义证明)
-
\(\lim\limits_{\lambda_0\to 0}|\lambda_0 E-A|=|A|\),利用该性质可以用可逆矩阵逼近不可逆矩阵,以使不可逆矩阵获得可逆矩阵的一些性质,以下是一个例子:
\(A=(a_{ij})_{n\times n}, B=(b_{ij})_{n\times n}\),证明 \((AB)^*=B^*A^*, A^*=\operatorname{adj}(A)\)(伴随矩阵)
证:当 \(A, B\) 为可逆矩阵,有 \((AB)^*=|AB|(AB)^{-1}=|A||B|B^{-1}A^{-1}=|B|B^{-1}|A|A^{-1}=B^*A^*\)
\(A, B\) 不都可逆时
定理 5.6
相似矩阵具有相同的特征多项式,特征值、特征向量和取定的基无关
5.3.3 特征多项式的基本性质
可知:
- 在复数域上,若 \(f (\lambda)=\prod\limits_{i=1}^n (\lambda-\lambda_i)\),则 \(\prod\limits_{i=1}^n\lambda_i=|A|,\sum\limits_{i=1}^n\lambda_i=\operatorname{tr}(A)\)
定理 5.7(\(\text{Hamilton-Cayley}\) 定理)
设 \(A\) 是 \(P\) 上的一个 \(n\) 阶方阵,\(f(\lambda)=|\lambda E-A|\) 是 \(A\) 的特征多项式,则
利用此性质可以将任意一个关于 \(A\) 的多项式化简为不超过 \(n-1\) 次的多项式。
注意,此处的 \(f(A)\) 不能简单认为是 \(|A E-A|\),实际上,
5.3.4 特征向量的线性无关性
定理 5.8
属于不同特征值的特征向量是线性无关的
有以下推论:
定理 5.9
对 \(A\) 的不同特征值 \(\lambda_1,\lambda_2,\cdots,\lambda_k\),若 \(X_{i1},X_{i2},\cdots,X_{ir_i}(i\in[k])\) 是属于特征值 \(\lambda_i(i\in[k])\) 的线性无关的特征向量组,则向量组
是线性无关的,证明见特征向量线性的无关性
5.4 矩阵的对角化
定理 5.10
\(n\) 阶矩阵 \(A\) 与对角阵相似 \(\Longleftrightarrow\) \(A\) 有 \(n\) 个线性无关的特征向量
给出一个构造性的证明
设 \(B=\operatorname{diag}[\lambda_1,\lambda_2,\cdots,\lambda_n]\sim A\),则 \(\exists P\) 使得 \(B=P^{-1}AP\)
可以发现,
从而 \(\lambda_iX_i=AX_i\) ,从而 \(X_i\) 是 \(A\) 的特征向量,又 \(P\) 可逆,于是有 \(A\) 有 \(n\) 个特征向量 \(X_1,X_2,\cdots,X_n\)
推论
- 一个 \(n\) 阶方阵 \(A\),如果它有 \(n\) 个不同的特征值,则 \(A\) 一定可以对角化
5.5 化对称矩阵为对角阵
实对称矩阵都可以被化为对角阵
定理 5.11
实对称阵的特征多项式的根都是实数,证明见 定理 5.11
定理 5.12
实对称矩阵属于不同特征值的特征向量是正交的,证明见 定理 5.12
定理 5.13
实对称阵一定正交相似于一个对角阵,证明见 定理 5.13
下面给出一种构造方案:
- 求出 \(A\) 的特征根 \(\lambda_1,\lambda_2,\cdots,\lambda_n\)
- 求出每个特征根 \(\lambda_1\) 对应的基础解系 \(\varepsilon_{i1},\varepsilon_{i2},\cdots,\varepsilon_{ir_i}\),并作施密特正交化,单位化
- 一共 \(n\) 个向量将其拼接得到 \(P\) 即可
5.6 正交变换
定义 5.8
正交变换是保持内积的线性变换,即 \(\forall \alpha,\beta\) 有 \((T(\alpha),T(\beta))=(\alpha,\beta)\)
事实上,这等价于保持长度的线性变换
定理 5.14
\(T\) 是 \(n\) 维度欧式空间的一个线性变换,如下四个命题等价:
- \(T\) 是正交变换
- \(\forall\alpha\in V,\Vert T(\alpha)\Vert=\Vert\alpha\Vert\)
- 若 \(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\) 是标准正交基,则 \(T(\varepsilon_1),T(\varepsilon_2),\cdots,T(\varepsilon_n)\) 也是标准正交基
- \(T\) 在任意一个标准正交基下的矩阵是正交矩阵
由第四条,我们知道正交变换的矩阵 \(A\) 是正交矩阵,因此有 \(|A|=\pm1\)
我们称 \(|A|=1\) 的正交变换为第一类正交变换,\(|A|=-1\) 的为第二类正交变换
比如,\(T_\theta\) 是第一类,按照 \(x\) 轴反射变换是第二类

浙公网安备 33010602011771号