浅析特征值与特征向量
最近在学习算法常常遇到特征值和特征向量的问题,一直都一知半解没有领悟到本质。因此特意查阅了相关资料,自己的理解写一篇小结。
1. 矩阵乘法的本质
首先,我们来看一个线性方程式。为了更简洁的表示,我们常常使用矩阵乘法。
线性方程式将x,y变化到m,n经过一个线性变换。同理,向量[x,y]与一个矩阵的乘积,得到向量[m,n],其实就相当于将这个向量[x,y]进行了线性变换。变换矩阵为:
因此,一个矩阵其实就是一个线性变换。
2.矩阵乘法的几何意义
为了更加直观的理解矩阵乘法(线性变换)的几何意义,我们看另一个变换矩阵A:
考虑下面的图像,绿色正方形说明施加到三个向量上的线性变换A。
可以看出在这种情况下变换仅仅是水平方向乘以因子2和垂直方向乘以因子0.5。同时,具体的几何表现是向量进行了旋转或拉伸。
其中,我们可以看到三个向量中的红色向量在线性变换时其方向保持不变,仅在该方向上进行了伸缩。这些向量就是线性变换的特征向量(描述这个矩阵变化方向),在特征向量的方向伸缩的值即为特征值(描述在这个方向上变化的大小)。
这些特征向量和特征值可以唯一地定义方形矩阵A。
3.特征向量和特征值的定义
教科书里面是这样定义的,A是n阶矩阵,如果数\(\lambda\)和n维非零列向量x使关系式:
成立,那么这样的数\(\lambda\)称为矩阵A的特征值,非零向量x称为A对应于特征值\(\lambda\)的特征向量。
上式也可写成
该齐次线性方程组有非零解的充分必要条件是系数行列式
左边\(|A- \lambda E|\)为\(\lambda\)的特征多项式。该式为矩阵A的特征方程,特征方程的解即为A的特征值。n阶矩阵A在复数范围内有n个特征值。
例如,计算矩阵
的特征值和特征向量。
解: A的特征多项式为
所以A的特征值为:\(\lambda_1\)=2, \(\lambda_2\)=4
当\(\lambda_1\)=2时,对应的特征向量应满足
解得\(x_1=x_2\),所以特征向量可取为
当\(\lambda_1\)=4时,对应的特征向量应满足
解得\(x_1=- x_2\), 所以特征向量可取为
4.特征向量和特征值的性质
对于常用的性质做以下总结:
- 求特征值的矩阵A必须为方阵
- n阶方阵A 有n个特征值
- 若\(p_i\)是矩阵A对应于特征值\(\lambda_i\)的特征向量,则特征向量的\(kp_i\)也是对应于特征值\(\lambda_i\)的特征向量
- 一个方阵的一组特征向量是一组正交向量
5.特征向量和特征值的应用
我们从前面了解到一个矩阵其实就是一个线性变换。特征值所对应的特征向量就是描述这个矩阵变化方向,我们通过特征值分解得到的前N个特征向量,就对应了这个矩阵最主要的N个变化方向。可以近似这个矩阵(变换)。也就提取这个矩阵最重要的特征。