LA@特征值和特征向量基本概念和计算方法
文章目录
特征值理论
- 工程技术中的一些问题,例如振动和稳定性问题,常归结为:求解一个方阵的特征值和特征向量问题
- 常常需要寻求数
λ
\lambda
λ和非零向量
α
\alpha
α,使得
A
α
=
λ
α
,
(
α
≠
0
)
\bold{A\alpha=\lambda\alpha,(\alpha\neq{0})}
Aα=λα,(α=0)
- 一般特征值和特征向量是成对存在的,在概念上,是相互依赖地同时定义出来
- 常常需要寻求数
λ
\lambda
λ和非零向量
α
\alpha
α,使得
A
α
=
λ
α
,
(
α
≠
0
)
\bold{A\alpha=\lambda\alpha,(\alpha\neq{0})}
Aα=λα,(α=0)
- 数学中的方阵对角化和解微分方程组等问题也需要用到特征值理论
特征值和特征向量定义
-
设 A \bold A A是 n n n阶方阵,若存在数 λ \lambda λ和 n n n维非零列向量 α ( α ≠ 0 ) \alpha(\alpha\neq{0}) α(α=0),满足 A α = λ α A\alpha=\lambda\alpha Aα=λα(1),则 λ \lambda λ称为 A \bold{A} A的特征值,非零向量 α \bold{\alpha} α称为 A \bold{A} A对应于 λ \lambda λ的一个特征向量
-
其中,方程(1)可以改写为:
- λ α − A α = 0 \bold{\lambda\alpha-A\alpha=0} λα−Aα=0,即 ( λ E − A ) α = 0 \bold{(\lambda{E}-A)\alpha=0} (λE−A)α=0(2)
- 或者 A α − λ E = 0 \bold{A\alpha-\lambda{E}=0} Aα−λE=0即: ( A − λ E ) α = 0 \bold{(A-\lambda{E})\alpha=0} (A−λE)α=0(2.1)
- 显然,方程(2)两边同时乘以 − 1 -1 −1,即得到 ( 2.1 ) (2.1) (2.1)
- 两个方程的系数矩阵的关系为分别为 B 1 = λ E − A \bold{B_1=\lambda{E}-A} B1=λE−A, B 2 = A − λ E \bold{B_2=A-\lambda{E}} B2=A−λE, − B 1 = B 2 \bold{-B_1=B_2} −B1=B2, ∣ − B 1 ∣ = ∣ B 2 ∣ \bold{|-B_1|=|B_2|} ∣−B1∣=∣B2∣, ( − 1 ) n ∣ B 1 ∣ = ∣ B 2 ∣ (-1)^{n}\bold{|B_1|=|B_2|} (−1)n∣B1∣=∣B2∣
- B 1 x = 0 \bold{B_1x=0} B1x=0有非零解的条件是 ∣ B 1 ∣ = 0 |\bold{B}_1|=0 ∣B1∣=0,这等价于 ∣ B 2 ∣ = 0 |\bold{B}_2|=0 ∣B2∣=0,还等价于 B 2 x = 0 \bold{B_2x=0} B2x=0有非零解
- 因此只需要任意选择(2),(2.1)中的一个研究即可,效果等价
-
例如选择方程(2)进行研究,其可以抽象为一个齐次线性方程: ( λ E − A ) x = 0 (\bold{\lambda{E}-A})\bold{x}=\bold{0} (λE−A)x=0(3)
-
但是实际上求解特征值和特征向量时,我推荐用: ( A − λ E ) = 0 (\bold{A-\lambda{E}})=\bold{0} (A−λE)=0(4),特别是 A \bold{A} A的阶数较大时.
-
为了全面性,下面分别用(3),(4)推理和求解相关问题
特征多项式
-
方程 ( 3 ) (3) (3)是一个含 n n n个未知数和 n n n个方程的齐次线性方程组,它有非零解的充要条件是 ∣ λ E − A ∣ = 0 |\bold{\lambda{E}-A}|=0 ∣λE−A∣=0
-
记系数矩阵为 f ( λ ) = ∣ λ E − A ∣ f(\lambda)=|\bold{\lambda{E}-A}| f(λ)=∣λE−A∣
-
若记 B = λ E − A \bold{B=\lambda{E}-A} B=λE−A,则方程(4)可以作 f ( λ ) = ∣ B ∣ = 0 f(\lambda)=|\bold B|=0 f(λ)=∣B∣=0
-
设 n n n阶方阵 A = ( a i j ) A=(a_{ij}) A=(aij),则 f ( λ ) f(\lambda) f(λ)可以展开为:
-
− A = ( − a 11 − a 12 ⋯ − a 1 n − a 21 − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ − a n n ) λ E = ( λ 0 ⋯ 0 0 λ ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ λ ) -\bold A=\begin{pmatrix} -a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& -a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&-a_{nn} \\ \end{pmatrix} \\ \lambda{\bold E}= \begin{pmatrix} \lambda& 0& \cdots&0 \\ 0& \lambda& \cdots&0 \\ \vdots& \vdots& &\vdots \\ 0& 0& \cdots&\lambda \\ \end{pmatrix} −A= −a11−a21⋮−an1−a12−a22⋮−an2⋯⋯⋯−a1n−a2n⋮−ann λE= λ0⋮00λ⋮0⋯⋯⋯00⋮λ
-
f ( λ ) = ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 ⋯ − a 1 n − a 21 λ − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ λ − a n n ∣ f(\lambda)=|\bold{\lambda{E}-A}|= \begin{vmatrix} \lambda-a_{11}& -a_{12}& \cdots&-a_{1n} \\ -a_{21}& \lambda-a_{22}& \cdots&-a_{2n} \\ \vdots& \vdots& &\vdots \\ -a_{n1}& -a_{n2}& \cdots&\lambda-a_{nn} \\ \end{vmatrix} f(λ)=∣λE−A∣= λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−ann
-
f ( λ ) f(\lambda) f(λ)是 A \bold{A} A的特征多项式,它是关于 λ \lambda λ的 n n n次多项式
-
-
特征方程
- A \bold A A的特征方程可以写作: f ( λ ) = 0 f(\lambda)=0 f(λ)=0(4)
征值的计算(行列式计算)
- 显然, A \bold{A} A的特征值就是特征方程的解;(有 n n n个复数解,重根按重数计)
特征值的个数
- 代数学基本定理:任何一个非零的一元n次复系数多项式,都正好有 n n n个复数根(重根视为多个根)
- 根据代数学基本定理,特征方程在复数范围内的解个数为方程的次数 n n n(若有重根则累计重数)
- 因此 n n n阶矩阵 A \bold{A} A在复数范围内有 n n n个特征值
计算方阵的特征向量(齐次线性方程组的解)
-
设解特征方程 f ( λ ) = 0 f(\lambda)=0 f(λ)=0的全部根为 λ i , i = 1 , 2 , ⋯ , n \lambda_i,i=1,2,\cdots,n λi,i=1,2,⋯,n
-
对于每个 λ i \lambda_i λi,构造并求解对应的齐次线性方程组 ( λ i E − A ) x = 0 \bold{(\lambda}_{i}\bold{{E-A})x=0} (λiE−A)x=0
- 不妨记方阵 B i = λ i E − A \bold{B}_i=\lambda_{i}\bold{E-A} Bi=λiE−A,便于讨论
- 求特征向量齐次线性方程 B i x = 0 \bold{B_{i}x=0} Bix=0(5)一组基础解系: S i = α 1 , α 2 , ⋯ , α s i S_i=\alpha_1,\alpha_2,\cdots,\alpha_{s_i} Si=α1,α2,⋯,αsi, s i = n − r i s_i=n-r_i si=n−ri其中 r i r_i ri是方程(5)的系数矩阵的 B i B_i Bi的秩
- 则方阵A关于 λ i \lambda_i λi的全部特征向量表示为 ∑ j = 1 s i k j α j \sum\limits_{j=1}^{s_i}k_j\alpha_j j=1∑sikjαj
特征值和特征向量的数量关系👺
-
特征向量与其对应的特征值数量关系
-
若 λ 0 \lambda_0 λ0是 A \bold{A} A的特征值,则 A α = λ 0 α \bold A\alpha=\lambda_0\alpha Aα=λ0α
-
其特征向量线性方程组 ( λ E − A ) x = 0 (\lambda{\bold{E}-A})x=\bold{0} (λE−A)x=0的系数矩阵 B = ( λ E − A ) B=(\bold{\lambda{E}-A}) B=(λE−A)的行列式 ∣ B ∣ |\bold{B}| ∣B∣取值是否为0对应不同情况
- ∣ B ∣ = 0 \bold{|B|}=0 ∣B∣=0时, λ 0 \lambda_0 λ0的特征向量有无穷多个
- ∣ B ∣ ≠ 0 |\bold{B}|\neq{0} ∣B∣=0时, λ 0 \lambda_0 λ0对应的特征向量仅一个
-
-
特征值被特征向量唯一确定(一个特征向量只能属于一个特征值)
- 但这不是说不同的特征向量一定对应于不同的特征值,类似于函数,每一个自变量取值都唯一对应于一个函数值,不同自变量的函数值没有制约关系: f ( x ) = ( x − x 1 ) ( x − x 2 ) f(x)=(x-x_1)(x-x_2) f(x)=(x−x1)(x−x2), f ( x 1 ) = f ( x 2 ) f(x_1)=f(x_2) f(x1)=f(x2)
- 证明:
- 假设对于给定的向量 α 0 \alpha_0 α0,数 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2,方阵 A \bold{A} A满足: A α 0 = λ i α 0 , i = 1 , 2 \bold{A}\alpha_0=\lambda_i\alpha_0,i=1,2 Aα0=λiα0,i=1,2
- 显然: λ 1 α 0 = λ 2 α 0 = A α 0 \lambda_1\alpha_0=\lambda_2\alpha_0=\bold{A}\alpha_0 λ1α0=λ2α0=Aα0
-
(
λ
1
−
λ
2
)
α
0
=
0
(\lambda_1-\lambda_2)\alpha_0=\bold 0
(λ1−λ2)α0=0
- 又因为 α 0 ≠ 0 \alpha_0\neq{\bold 0} α0=0,所以 λ 1 − λ 2 = 0 \lambda_1-\lambda_2=0 λ1−λ2=0
- 所以 λ 1 = λ 2 \lambda_1=\lambda_2 λ1=λ2
- 所以给定 α 0 \alpha_0 α0, A \bold{A} A的特征值是唯一确定的
例
-
( 3 1 2 2 ) ( 1 1 ) = ( 4 4 ) = 4 ( 1 1 ) \begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} \begin{pmatrix} 1\\ 1 \end{pmatrix} =\begin{pmatrix} 4 \\ 4 \end{pmatrix} =4\begin{pmatrix} 1 \\ 1 \end{pmatrix} (3212)(11)=(44)=4(11)
-
上述等式链告诉我们,矩阵
-
A = ( 3 1 2 2 ) 作用在向量 α = ( 1 1 ) 上的效果和常数 4 作用在 α 上的效果在乘法上是一样的 A=\begin{pmatrix} 3&1 \\ 2&2 \end{pmatrix} 作用在向量\alpha=\begin{pmatrix} 1\\ 1 \end{pmatrix} \\上的效果和常数4作用在\alpha上的效果在乘法上是一样的 A=(3212)作用在向量α=(11)上的效果和常数4作用在α上的效果在乘法上是一样的
- 也就是说,矩阵左乘特征向量的结果和特征向量左乘特征向量的结果一样
-
例
-
设 A 2 = A A^2=A A2=A,证明A的特征值为0或1
-
A α = λ α A 2 α = A ( A α ) = A λ α = λ ( A α ) = λ ( λ α ) = λ 2 α 又 A 2 = A ; A 2 α = A α = λ α A\alpha=\lambda{\alpha} \\A^2\alpha=A(A\alpha)=A\lambda\alpha=\lambda{(A\alpha)}=\lambda(\lambda\alpha)=\lambda^2\alpha \\又A^2=A;A^2\alpha=A\alpha=\lambda\alpha Aα=λαA2α=A(Aα)=Aλα=λ(Aα)=λ(λα)=λ2α又A2=A;A2α=Aα=λα
-
∴ λ 2 α = λ α ( λ 2 − λ ) α = 0 , α ≠ 0 λ 2 − λ = λ ( λ − 1 ) = 0 λ = 0 或 1 \\\therefore \lambda^2\alpha=\lambda\alpha \\(\lambda^2-\lambda)\alpha=\bold{0},\alpha\neq\bold0 \\\lambda^2-\lambda=\lambda(\lambda-1)=0 \\\lambda=0或1 ∴λ2α=λα(λ2−λ)α=0,α=0λ2−λ=λ(λ−1)=0λ=0或1
-
-
方法2:
-
同时对 A α = λ α 左乘 A : A 2 α = λ ( A α ) A α = λ 2 α λ α = λ 2 α 同时对A\alpha=\lambda\alpha左乘A: \\A^2\alpha=\lambda(A\alpha) \\A\alpha=\lambda^{2}\alpha \\\lambda\alpha=\lambda^2{\alpha} 同时对Aα=λα左乘A:A2α=λ(Aα)Aα=λ2αλα=λ2α
-
其余和方法1一致
-
例:计算方阵的特征值及其对应的特征向量
-
这里使用方程(4)来推理
-
求矩阵 A = ( 3 − 1 − 1 3 ) \bold{A}=\begin{pmatrix}3&-1\\-1&3\end{pmatrix} A=(3−1−13)的特征值和特征向量
-
按方程(4)构造特征多项式 f ( λ ) = A − λ E f(\lambda)=\bold{A-\lambda{E}} f(λ)=A−λE= ∣ 3 − λ − 1 − 1 3 − λ ∣ \begin{vmatrix}3-\lambda&-1\\-1&3-\lambda\end{vmatrix} 3−λ−1−13−λ = ( 3 − λ ) 2 − 1 (3-\lambda)^2-1 (3−λ)2−1= ( 4 − λ ) ( 2 − λ ) (4-\lambda)(2-\lambda) (4−λ)(2−λ)
-
可知 A \bold{A} A特征值有 λ 1 = 2 \lambda_1=2 λ1=2, λ 2 = 4 \lambda_2=4 λ2=4
-
当 λ 1 = 2 \lambda_1=2 λ1=2,对应的特征方程: A 1 x = 0 \bold{A_1x=0} A1x=0
-
∣ 3 − 2 − 1 − 1 3 − 2 ∣ x = 0 \begin{vmatrix}3-2&-1\\-1&3-2\end{vmatrix}\bold{x}=\bold{0} 3−2−1−13−2 x=0
-
解得 x 2 = x 3 x_2=x_3 x2=x3
-
可取基础解系为 p 2 = ( 1 , 1 ) T \bold{p}_2=(1,1)^T p2=(1,1)T
-
-
当 λ 2 = 4 \lambda_2=4 λ2=4,对应的特征方程: A 2 x = 0 \bold{A_2x=0} A2x=0
-
∣ 3 − 4 − 1 − 1 3 − 4 ∣ x = 0 \begin{vmatrix}3-4&-1\\-1&3-4\end{vmatrix}\bold{x}=\bold{0} 3−4−1−13−4 x=0
-
解得 x 2 = − x 3 x_2=-x_3 x2=−x3
-
可取基础解系为 p 2 = ( − 1 , 1 ) T \bold{p}_2=(-1,1)^T p2=(−1,1)T
-
-
显然, p i \bold{p_i} pi是矩阵 A \bold{A} A对应于特征值 λ i \lambda_i λi的特征向量,则 k p i ( k ≠ 0 ) k\bold{p}_i(k\neq{0}) kpi(k=0)也是对应于 λ i \lambda_i λi的特征值
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了