线性代数精华——矩阵的特征值与特征向量

今天和大家聊一个非常重要,在机器学习领域也广泛使用的一个概念——矩阵的特征值与特征向量。

我们先来看它的定义,定义本身很简单,假设我们有一个n阶的矩阵A以及一个实数λ,使得我们可以找到一个非零向量x,满足:

Ax=λx

如果能够找到的话,我们就称λ是矩阵A的特征值,非零向量x是矩阵A的特征向量。


几何意义


光从上面的式子其实我们很难看出来什么,但是我们可以结合矩阵变换的几何意义,就会明朗很多。

我们都知道,对于一个n维的向量x来说,如果我们给他乘上一个n阶的方阵A,得到Ax。从几何角度来说,是对向量x进行了一个线性变换。变换之后得到的向量y和原向量x的方向和长度都发生了改变。

但是,对于一个特定的矩阵A来说,总存在一些特定方向的向量x,使得Ax和x的方向没有发生变化,只是长度发生了变化。我们令这个长度发生的变化当做是系数λ,那么对于这样的向量就称为是矩阵A的特征向量,λ就是这个特征向量对应的特殊值。


求解过程


我们对原式来进行一个很简单的变形:

(AλI)x=0

这里的I表示单位矩阵,如果把它展开的话,可以得到一个n元的齐次线性方程组。这个我们已经很熟悉了,这个齐次线性方程组要存在非零解,那么需要系数行列式

|AλI|

不为零,也就是系数矩阵的秩小于n。

我们将这个行列式展开:

|a11λa12a1na21a22λa2nan1an2anmλ|

这是一个以λ为未知数的一元n次方程组,n次方程组在复数集内一共有n个解。我们观察上式,可以发现λ只出现在正对角线上,显然,A的特征值就是方程组的解。因为n次方程组有n个复数集内的解,所以矩阵A在复数集内有n个特征值。

我们举个例子,尝试一下:

假设:

A=[a11λa12a21a22λ]

那么f(λ)=(a11λ)(a22λ)a12a21=λ2(a11+a22)λ|A|,我们套入求根公式可以得出使得f(λ)=0的两个根λ1,λ2,有:λ1+λ2=a11+a22,λ1λ2=|A|

这个结论可以推广到所有的n都可以成立,也就是说对于一个n阶的方阵A,都可以得到:

  1. λ1+λ2++λn=a11+a22++ann
  2. λ1λ2λn=|A|

案例


我们下面来看一个例子:

A=[3113]

我们带入(AλI)x=0,可以得到:

|3λ113λ|=0

所以: (3λ)21=0,可以看出来λ1=2,λ2=4

λ=2时:

[3113]x=2x

[3113][a1,a2]T=[2a1,2a2]T

3a1+a2=2a1a1+3a2=2a2

解之,可以得到:a1+a2=0,所有(x,x)向量都是A的特征向量。

同理,当λ=4时:

[3113]x=4x[3113][a1,a2]T=[4a1,4a2]T3a1+a2=4a1a1+3a2=4a2

解之,可以得到:a1=a2,所有(x,x)向量都是A的特征向量。


使用Python求解特征值和特征向量


在我们之前的文章当中,我们就介绍过了Python在计算科学上的强大能力,这一次在特征值和特征矩阵的求解上也不例外。通过使用numpy当中的库函数,我们可以非常轻松,一行代码,完成特征值和特征向量的双重计算。

我们一起来看代码:

import numpy as np

a = np.mat([[3, 1], [1, 3]])
lam, vet = np.linalg.eig(a)

np.linalg.eig 方法会返回两个值,第一个返回值是矩阵的特征值,第二个返回值是矩阵的特征向量,我们看下结果:

这里的特征向量为什么是0.707呢?因为Python自动帮我们做好了单位化,返回的向量都是单位向量,不得不说实在是太贴心了。


总结


关于矩阵的特征值和特征向量的介绍到这里就结束了,对于算法工程师而言,相比于具体怎么计算特征向量以及特征值。理解清楚它们的概念和几何意义更加重要,因为这两者在机器学习的领域当中广泛使用,在许多降维算法当中,大量使用矩阵的特征值和特征向量。

对于降维算法的原理,这里不过多赘述,我们会在以后的文章当中更新相关内容。感兴趣的同学可以小小期待一下。

文章到这里就结束了,这也是线性代数专题的最后一篇文章,短短六篇文章当然不能涵盖线性代数这门学科当中的所有知识点,但实际当中常用的内容基本上已经都包括了。下周我们将开始全新的Python专题,希望大家多多期待。

如果觉得有所收获,请顺手点个关注或者转发吧,你们的支持是我最大的动力。

posted @   Coder梁  阅读(1469)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示