线性代数笔记22——特征值和特征向量
特征向量
函数通常作用在数字上,比如函数f作用在x上,结果得到了f(x)。在线性代数中,我们将x扩展到多维,对于Ax来说,矩阵A的作用就像一个函数,输入一个向量x,通过A的作用,得到向量Ax。对多数向量x而言,经过Ax的转换后将得到不同方向的向量,但总有一些特殊的向量,它的方向和Ax方向相同,即Ax平行于x,这些特殊的向量就是特征向量。
平行的向量用方程来表示比较简单:
其中A是方阵,x≠0。λ是一个系数,被称为特征系数或特征值;x和λx平行,方程的解x就是A的特征向量。
这里需要对“方向相同”做出一些特殊的解释,它也包括正好相反的方向和无方向,所以λ的值可以取0或负数。
求解特征向量
现在的问题是,给定矩阵A,如果求解A的特征向量?这里没有Ax = b这样的方程,只有Ax=λx,其中λ和x都是未知数,如何求解呢?在解释之前,先看看投影矩阵的特征向量。
投影矩阵的特征向量
假设有个一个平面,给定投影矩阵P,投影矩阵的特征向量有哪些?特征值又是什么?
这实际上是在回答那些向量的投影和向量本身平行,像下面这样随意投影肯定不行:
x在平面的投影是Px,二者的方向不相同,因此图中的x不是P的特征向量。
如果x正好在平面上,那么它的投影就是x本身,所以位于平面上的所有向量都是P的特征向量,此时特征值λ=1,Px=x。此外,垂直于平面的向量在平面上的投影是零向量,即Px = 0 = 0x,这相当于特征值λ=0,所以垂直于平面的向量也是P的特征向量。
矩阵的迹
再看一个特例:
A乘以什么样的向量将得到一个同方向的向量?即A的特征值和特征向量是什么?
很容易看出:
A还有其它的特征值:
上面的答案符合两个关于特征值的性质:
- n×n矩阵有n个特征值。
- 矩阵的所有特征值之和等于该矩阵的主对角线元素之和,这个和数叫做A的迹。
特征方程
现在到了面对Ax=λx的时候,弄清楚如何求解λ和x。
解决的方法是将λx移到等式左侧:
更进一步,可以利用λx = λIx将λ向量化,变成:
复习一下零空间,对于Ax = 0来说,如果A的各列是线性无关的,意味着方程组只有一个全零解。把这句话放到新方程中,如果(A-λI) 的各列是线性无关的,意味着只有一个解,x=0。但是特征向量不能是零向量,所以需要新方程还有其它解,这意味着(A-λI) 的各列是线性相关的,即A-λI是一个奇异矩阵。由于奇异矩阵的行列式是0,因此可以得到结论:
这就没x什么事了,得到了一个关于λ的方程,该方程叫做特征方程或特征值方程。可以根据特征方程先求解出λ,当然,对于n阶方阵会求出n个λ。知道λ后就容易多了,把每个λ代入(A-λI)x=0,然后找出它的零空间。(关于零空间,可参考《线性代数笔记12——列空间和零空间》)
来看一个示例:
先求解A的特征值:
A的迹是所有特征值之和,它等于主对角线元素之和,这可以用来作为特征值求解的初步验证。接下来求解每个特征值对应的特征向量:
容易判断零空间的基是:
这也是特征值λ1对应的特征向量,实际上零空间中的所有向量都是λ1对应的特征向量。
用同样的方法求出λ2对应的特征向量:
复数特征值
值得注意的是,特征值未必是实数,比如下面的矩阵:
此时特征值是复数,λ=±i
综合示例
召唤一个矩阵A:
找出A,A2,A-1的特征值和特征向量。
先看简单的,求解A的特征值比较容易:
第一列中有两个0,所以将这个行列式以第一列展开:
三个特征值之和等于A的主对角元素之和。
接下来求解特征值:
方程的一组解就是特征向量:
接下来求出另外两个特征向量:
找出对应的零空间,先化简为行阶梯矩阵:
当x3 = 1时,将得到一组特征向量:
继续计算λ3的特征向量:
当x3 = 1时,将得到一组特征向量:
接下来计算A2的特征值,这将是个浩大的工程,我们更想让它变得容易一点,已知Ax=λx,现在将A再左乘一个A变成A2:
等式的源头是Ax=λx,假设x是已知的,它已经被求得,因此这个式子告诉我们,如果已知A的特征向量,那么它也是A2的特征向量,只不过特征值换成了λ2。
类似地,A-1x也可以做一些演变:
A-1的特征值就是1/λ,,它的特征值和A的特征值相同。
作者:我是8位的