线性代数及其应用 第五章
第 5 章 特征值与特征向量
本章的目的是剖析线性变换
5.1 特征向量与特征值
定义
为 矩阵, 为非零向量,若存在数 使 有非平凡解 ,则称 为 的特征值, 称为对应于 的特征向量。
验证
方程
定理 1
三角形矩阵的主对角线的元素是其特征值。
假设
是 上三角形矩阵,则 当方程
存在非平凡解,主对角线元素至少有一个为零,当 取 满足条件,它们就是 的特征值。 是下三角形矩阵是同理。得证。
定理 2
是 矩阵 相异的特征值, 是与 对应的特征向量,那么向量集合 线性无关。
反证法。假设
线性相关。 非零,令 是最小的满足 是前面向量的线性组合的下标。即存在 满足 左右同乘
: 将前式乘
,作差可得 因为
线性无关, 相异, ,则 ,矛盾。则 线性无关。得证。
特征向量与差分方程
对于一阶差分方程
构造解的最简单方法是取
5.2 特征方程
求
相似性
下列定理说明了特征多项式的一个用途,为某些近似计算特征值的迭代算法提供了理论基础。
假设
定理 3
若
矩阵 和 是相似的,那么它们有相同的特征多项式,从而有相同的特征值(和相同的重数)。
有
,那么 则
一个广泛用来估计一般矩阵
其将
应用到动力系统
设
,分析由 所确定的动力系统的长期发展趋势。
第一步解出
的特征值 ,得到对应特征向量 和 。 第二步,
是 的基,将 表示为它们的线性组合: 得到
那么
的显式公式就是差分方程的解。容易得到
5.3 对角化
分解式
计算
如果方阵
定理 4(对角化定理)
矩阵 可对角化的充分必要条件是 有 个线性无关的特征向量。 事实上,
, 为对角矩阵的充分必要条件是 的列向量是 的 个线性无关的特征向量。此时 的主对角线上的元素分别是 的对应于 中特征向量的特征值。
换句话说,
若
是列为 的 矩阵, 是对角线元素为 的对角矩阵,则 假设
可对角化且 ,则 ,可得 由于
可逆, 线性无关。这说明 是特征值, 为相应的特征向量。命题必要性得证,而充分性也是简单的。
矩阵的对角化
对角化工作分为以下四步:
验证正确性,只需满足
定理 5
有
个相异特征值的 矩阵可对角化。
定理 6
设
是 矩阵,其相异的特征值是 。
对于 , 的特征空间的维数小于或等于 的代数重数。
矩阵 可对角化的充分必要条件是所有不同特征空间的维数之和为 。即 特征多项式可完全分解为线性因子, 每个 的特征空间的维数等于 的代数重数。
若 可对角化, 是对应于 的特征空间的基,则 中所有向量的集合是 的特征向量基。
5.4 特征向量与线性变换
我们研究线性变换
线性变换的特征向量
特征值和特征向量在
已知正弦波信号
,左双移位线性变换 由 定义。 令
,利用三角函数公式可得 ,这说明 是 的特征向量,其特征值为 。
线性变换的矩阵
目前只考虑与有限维向量空间相关的线性变换和矩阵。
有
若
由于坐标映射是线性的:
改写为
其中
矩阵
故就坐标向量而言,
的映射 : 是线性变换( 是微分算子)。 若基
,写出 的 坐标即可得到 的 矩阵: 对一般多项式
,可以验证
上的线性变换
定理 7(对角矩阵表示)
设
, 为 对角矩阵,若 的基 由 的列向量构成,那么 是变换 的 矩阵。
设
, 。此时 是 4.4 节中提到的坐标变换矩阵 ,满足 若
, ,则 由于
, 。
此时
矩阵表示的相似性
上一定理的证明与
于是
反之,若
5.5 复特征值
考虑
对复特征值的研究能够揭示某些实矩阵中隐藏的信息。这些问题包括很多蕴涵周期运动的实动力系统、振动或空间的某种旋转。
假设
, 上的线性变换 将平面逆时针旋转 圈,其显然在 中无特征向量。已知其特征方程 只有复根
。让 作用于 ,可以得到 和 是特征值, 和 是对应的特征向量。
设
,求其特征值及每个特征空间的基。
由行列式容易解得
,对 ,有 其给出了两个
和 之间的等式。实际上它们一定描述同一个关系,由 ,可得其对应特征空间的基为 ,对于另一个特征值也用相同的方法即可,而验算结果是否正确是较为简单的。
向量的实部和虚部
向量
复数的共轭运算性质对复矩阵代数是成立的。
作用于 上的实矩阵的特征值和特征向量
若
故
设非零实矩阵
,它的特征值是 ,设 , 为 的辐角,有 变换
可视为旋转 和倍乘 的复合。
接着用前面的例子来揭示有复特征值的实矩阵中隐含的旋转:
设
实矩阵 : 可得
。旋转产生的是椭圆,因为由 的列确定的坐标系不是长方形的,在两个轴上没有相等的单位长。
定理 8
设
实矩阵 有复特征值 及对应的 中复特征向量 ,那么 其中
首先
和 显然是线性无关的, , , ,于是考虑证明 。 得证。
5.6 离散动力系统
在 5.2 节中有简单提到。
生态问题比物理或工程上的问题更容易描述和解释。控制系统中的稳态响应在工程上等价于动力系统
假设
对于初始向量
若仅
解的几何意义
对于
-
当两个特征值的绝对值均小于
,轨迹趋于原点,称为动力系统的吸引子。过原点且特征值绝对值最小的特征向量 的直线的方向是最大吸引方向。 -
当两个特征值的绝对值均大于
,轨迹远离原点,称为动力系统的排斥子。过原点且特征值绝对值最大的特征向量 的直线的方向是最大排斥方向。 -
当两个特征值的绝对值分别
和 ,原点在某些方向有吸引解,某些方向有排斥解,称为鞍点。最大吸引、排斥方向同上。
在线性动力系统中只有原点可能是吸引子或排斥子,而在非线性的更一般的动力系统中可能存在多个吸引子和排斥子。
显然对于一般的
若
5.7 在微分方程中的应用
在很多应用问题中,某些量随时间连续变化,与下列微分方程组有关:
其中
方程显然是线性的,其解为向量值函数,定义在某实数区间。若
零函数也是方程的(平凡)解。方程的解集是值属于
微分方程相关的教材证明了方程存在基础解系,它是解集的基,那么解集就是函数的
若给定向量
若
则有
关于函数的求解与动力系统的解耦需要微积分知识,暂且略过。
5.8 特征值的迭代估计
幂算法
适用于
简单起见,令
显然地,
假设
则当
则
若对
当
估计严格占优特征值的幂算法
选择一个最大分量为 的初始向量 。
对
计算 。
设 是 中绝对值最大的一个分量。
计算 。
几乎对所有选择的 ,序列 近似于主特征值,而序列 近似于对应的特征向量。
序列的收敛速度取决于
若随机的
逆幂法
若
在知道特征值
对应特征向量不变。假设
估计
的特征值 的逆幂法
选择一个非常接近于 的初始估值 。
选择一个最大分量为 的初始向量 。
对 ,
由 解出 。
设 是 中绝对值最大的分量。
计算 。
计算 。
几乎对所有 , 趋于 的特征值 , 趋于对应特征向量。
5.9 在马尔可夫链中的应用
马尔可夫链在多种领域中做数学模型,这里略过一些简单的实用性例子。
定义
一个具有非负元素且各元素的数值相加等于 的向量称为概率向量。随机矩阵是各列向量均为概率向量的方阵。
马尔可夫链是一个概率向量序列
用一阶差分方程刻画:
预言遥远的未来
马尔可夫链最有趣的方面是对该链长期行为的研究。
定理 9(随机矩阵)
如果
是一个随机矩阵,那么 是 的一个特征值。
各行之和为 , 是各元素为 的向量,那么 ,说明 是 的特征向量,对应特征值为 。可以证明 和 有相同特征值,故 是 的特征值。
稳态向量
随机矩阵
我们称一个矩阵是正则的,如果矩阵的某次幂
定理 10
如果
是一个 的正则随机矩阵,则 具有唯一的稳态向量 。此外,若 是任一个初始状态,且 ,则 时,马尔可夫链 收敛到 。
它说明初始状态不影响马尔可夫链的长期行为。
本文作者:SE の 摆烂窝
本文链接:https://www.cnblogs.com/SError0819/p/18324216
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步