LA@相似对角化判定定理和计算方法
文章目录
方阵相似对角化
引言
- 如果方阵 A ∼ Λ \bold{A}\sim{\bold{\Lambda}} A∼Λ,且 Λ \bold{\Lambda} Λ是一个对角阵(方阵),则称 A \bold{A} A可以相似对角化(简称为对角化)
相似对角化变换矩阵的性质
-
设 n n n阶矩阵 A \bold{A} A可以被分解为 A = P Λ P − 1 \bold{A=P\Lambda{P^{-1}}} A=PΛP−1
(1)
,即 P − 1 A P = Λ \bold{P^{-1}AP=\Lambda} P−1AP=Λ(2)
,不妨将 P \bold{P} P称为相似对角化变换矩阵,简称对角化变换矩阵 -
由
(2)
两边同时作乘 P − 1 \bold{P}^{-1} P−1有: A P = P Λ \bold{AP=P\Lambda} AP=PΛ(3)
-
设 P \bold{P} P用其列向量表示为 P = ( p 1 , ⋯ , p n ) \bold{P}=(\bold p_1,\cdots,\bold p_n) P=(p1,⋯,pn), Λ = diag ( λ 1 , ⋯ , λ n ) \bold{\Lambda}=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn)代入
(3)
的两边,即得-
A ( p 1 , ⋯ , p n ) {\bold A(\bold p_1,\cdots,\bold p_n)} A(p1,⋯,pn)= ( p 1 , ⋯ , p n ) Λ (\bold p_1,\cdots,\bold p_n)\bold{\Lambda} (p1,⋯,pn)Λ
(3.1)
-
( p 1 , ⋯ , p n ) ( λ 1 λ 2 ⋱ λ n ) = ( λ 1 p 1 , ⋯ , λ n p n ) (\bold p_1,\cdots,\bold p_n) \begin{pmatrix} {{\lambda _1}} & {} & {} & {} \cr {} & {{\lambda _2}} & {} & {} \cr {} & {} & \ddots & {} \cr {} & {} & {} & {{\lambda _n}} \cr \end{pmatrix} =(\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n}) (p1,⋯,pn) λ1λ2⋱λn =(λ1p1,⋯,λnpn)
-
-
(3.1)
两边化简-
(
A
p
1
,
⋯
,
A
p
n
)
(\bold{A}\bold p_1,\cdots,\bold{A}\bold p_n)
(Ap1,⋯,Apn)=
(
λ
1
p
1
,
⋯
,
λ
n
p
n
)
(\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n})
(λ1p1,⋯,λnpn)
(3.2)
-
(
A
p
1
,
⋯
,
A
p
n
)
(\bold{A}\bold p_1,\cdots,\bold{A}\bold p_n)
(Ap1,⋯,Apn)=
(
λ
1
p
1
,
⋯
,
λ
n
p
n
)
(\lambda_1\bold{p}_1,\cdots,\lambda_n{\bold{p}_n})
(λ1p1,⋯,λnpn)
-
于是 A p i = λ i p i \bold{Ap}_i=\lambda_i\bold{p}_i Api=λipi, i = 1 , ⋯ , n i=1,\cdots,n i=1,⋯,n
(4)
-
可见, λ i \lambda_i λi是 A \bold{A} A的特征值, p i \bold{p}_i pi就是 A \bold{A} A对应于 λ i \lambda_i λi的特征向量
-
反之,若已知矩阵 Q = ( q 1 , ⋯ , q n ) \bold{Q}=(\bold{q}_1,\cdots,\bold{q}_n) Q=(q1,⋯,qn)的列向量满足: A q i = λ i q i \bold{A}\bold{q}_i=\lambda_i\bold{q}_i Aqi=λiqi, i = 1 , ⋯ , n i=1,\cdots,n i=1,⋯,n则有
- ( A q 1 , ⋯ , A q n ) (\bold{A}\bold q_1,\cdots,\bold{A}\bold q_n) (Aq1,⋯,Aqn)= ( λ 1 q 1 , ⋯ , λ n q n ) (\lambda_1\bold{q}_1,\cdots,\lambda_n{\bold{q}_n}) (λ1q1,⋯,λnqn),即
- A ( q 1 , ⋯ , q n ) {\bold A(\bold q_1,\cdots,\bold q_n)} A(q1,⋯,qn)= ( q 1 , ⋯ , q n ) Λ (\bold q_1,\cdots,\bold q_n)\bold{\Lambda} (q1,⋯,qn)Λ即
-
A
Q
=
Q
Λ
\bold{AQ}=\bold{Q\Lambda}
AQ=QΛ
(5)
构造对角化变换矩阵
-
由于n阶矩阵 A \bold{A} A恰好有 n n n个特征值 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn,并且可以对应地求得 n n n个特征向量 Q : q 1 , ⋯ , q n Q:\bold{q}_1,\cdots,\bold{q}_n Q:q1,⋯,qn,所以可以考虑将 Q = ( Q ) \bold{Q}=(Q) Q=(Q)作为对角化变换矩阵候选,此时一定有
(5)
成立 -
因为特征值对应的特征向量可能不唯一,所以候选矩阵 Q \bold{Q} Q可能不唯一,甚至可能是复矩阵
-
而且 Q \bold{Q} Q不一定是可逆方阵,需要添加限制条件: n n n阶矩阵 Q \bold{Q} Q是可逆矩阵,即 Q Q Q是线性无关的
-
如果满足这个附加条件,对
(5)
两边同时左乘 Q − 1 \bold{Q}^{-1} Q−1,得 Q − 1 A Q = Q − 1 Q Λ \bold{Q}^{-1}\bold{AQ}=\bold{Q}^{-1}\bold{Q\Lambda} Q−1AQ=Q−1QΛ= Λ \bold{\Lambda} Λ(6)
,也就是说, Q \bold{Q} Q就是 A \bold{A} A得对角化变换矩阵 -
上述讨论中心是矩阵 A \bold{A} A的特征值和特征向量的计算,我们希望可以建立一条基于 A \bold{A} A的可对角化判定定理和计算对角化变换阵的方法,上述讨论已经给出了这样的定理和条件,归纳如下节
方阵可对角化判定定理🎈
-
n n n阶矩阵 A \bold{A} A和一个对角阵相似的充要条件是 A \bold{A} A有 n n n个线性无关特征向量 P : p 1 , ⋯ , p n P:\bold{p}_1,\cdots,\bold{p}_n P:p1,⋯,pn
-
并且,由上述方法构造的对角化变换阵 P = ( P ) \bold{P}=(P) P=(P)将 A \bold{A} A变换为由 A \bold{A} A的 n n n个特征值构成的对角阵 Λ = diag ( λ 1 , ⋯ , λ n ) \bold\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn);即 P − 1 A P = diag ( λ 1 , ⋯ , λ n ) \bold{P^{-1}AP=\text{diag}(\lambda_1,\cdots,\lambda_n)} P−1AP=diag(λ1,⋯,λn)
-
下面继续推进这个结论,使得条件" n n n个线性无关特征向量"更加具体,有分为两大类情况
推论:无重根特征值的方阵可以对角化
- 重根特征值:指 A \bold{A} A的特征方程出现重根的那些根对应的特征值
- 无重根特征值的方阵可以对角化
- 由于 A \bold{A} A的不同特征值对应的特征向量是线性无关的,所以若 A \bold{A} A的特征向量 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn是互不相等的,那么 A \bold{A} A可以对角化
含重根特征值的方阵的对角化判定定理
- 有重根特征值的方阵不一定可对角化(这对应于重根特征值问题)
- 事实上, k k k重根特征值对应的特征向量线性无关组中的向量不超过 k k k个
- 所以含有重根特征值的方阵 A \bold{A} A的 n n n个特征向量向量不一定是线性无关的
总结👺
- 若 A \bold{A} A的特征值 λ i \lambda_i λi,( i = 1 , ⋯ , m i=1,\cdots,m i=1,⋯,m, m ⩽ n m\leqslant n m⩽n)的重数为 k i k_i ki, k i ⩾ 1 , ∑ i = 1 m k i = n k_i\geqslant{1},\sum_{i=1}^{m}k_i=n ki⩾1,∑i=1mki=n;则:方阵 A \bold{A} A可对角化的充要条件是特征值 λ i \lambda_i λi对应的特征向量中有 k i k_i ki个是线性无关的
综合:对角化步骤归纳
对角化问题的求解过程综合运用了矩阵特征值和特征向量等相关知识
- 求出方阵 A \bold{A} A所有特征值 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn
- 求解不同特征值
λ
i
\lambda_i
λi对应的齐次线性方程
(
λ
i
E
−
A
)
x
=
0
\bold{(\lambda}_{i}\bold{E-\bold{A})x=0}
(λiE−A)x=0
<1>
的基础解系- 判断基础解系中包含的向量个数是否和特征值 λ i \lambda_i λi的重数 n i n_i ni一致
- 如果所有特征值的重数 n i n_i ni和对应的基础解系向量个数一致,则 A \bold{A} A可以对角化
- 如果出现不一致,则 A \bold{A} A不可对角化
- 如果可对角化,则需要求解出一个可逆矩阵
P
\bold{P}
P,使得
P
−
1
A
P
=
Λ
\bold P^{-1}\bold{AP}=\bold\Lambda
P−1AP=Λ
- 设
A
\bold{A}
A的
n
n
n个线性无关特征向量为
P
:
p
1
,
⋯
,
p
n
P:\bold{p}_1,\cdots,\bold{p}_n
P:p1,⋯,pn,则
- P = ( P ) \bold{P}=(P) P=(P)
- Λ = diag ( λ 1 , ⋯ , λ n ) \bold\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_n) Λ=diag(λ1,⋯,λn)
- 设
A
\bold{A}
A的
n
n
n个线性无关特征向量为
P
:
p
1
,
⋯
,
p
n
P:\bold{p}_1,\cdots,\bold{p}_n
P:p1,⋯,pn,则
例
如果 A \bold{A} A可对角化的话,求 A \bold{A} A的对角化变换阵及其对角化矩阵
- A = ( 2 − 1 − 1 0 − 1 0 0 2 1 ) A=\begin{pmatrix} 2 & { - 1} & { - 1} \cr 0 & { - 1} & 0 \cr 0 & 2 & 1 \cr \end{pmatrix} A= 200−1−12−101
特征值计算
-
∣
λ
E
−
A
∣
=
(
λ
−
2
)
(
λ
+
1
)
(
λ
−
1
)
=
0
|\lambda{E}-A|=(\lambda-2)(\lambda+1)(\lambda-1)=0
∣λE−A∣=(λ−2)(λ+1)(λ−1)=0
- λ 1 = 2 , λ 2 = − 1 , λ 3 = 1 \lambda_1=2,\lambda_2=-1,\lambda_3=1 λ1=2,λ2=−1,λ3=1都是单根特征值,显然 A \bold{A} A可以对角化
构造相似变换阵
-
( λ 1 E − A ) x = 0 (\lambda_1{\bold E}-\bold{A})x=0 (λ1E−A)x=0
-
( 2 E − A ) x = 0 2 E − A = ( 0 1 1 0 3 0 0 − 2 1 ) → ( 0 1 0 0 0 1 0 0 0 ) \bold {(2E-A)x}=0 \\ \bold {2E-A}= \begin{pmatrix} 0 & 1 & 1 \cr 0 & 3 & 0 \cr 0 & { - 2} & 1 \cr \end{pmatrix} \to \begin{pmatrix} 0 & 1 & 0 \cr 0 & 0 & 1 \cr 0 & 0 & 0 \cr \end{pmatrix} (2E−A)x=02E−A= 00013−2101 → 000100010
-
x 2 = 0 x 3 = 0 x 1 可以是任意常数 可以取基础解系为 p = ( 1 , 0 , 0 ) T x_2=0 \\x_3=0 \\ x_1可以是任意常数 \\ 可以取基础解系为\bold{p}=(1,0,0)^T x2=0x3=0x1可以是任意常数可以取基础解系为p=(1,0,0)T
-
-
( λ 2 E − A ) x = 0 (\lambda_2\bold E-\bold{A})x=0 (λ2E−A)x=0
- ( − E − A ) x = 0 \bold {(-E-A)x=0} (−E−A)x=0,取基础解系 p 2 = ( 0 , − 1 , 1 ) T \bold{p}_2=(0,-1,1)^{T} p2=(0,−1,1)T
-
( λ 3 E − A ) x = 0 (\lambda_3\bold E-\bold{A})x=0 (λ3E−A)x=0
- ( E − A ) x = 0 \bold {(E-A)x=0} (E−A)x=0,取基础解系 p 3 = ( 1 , 0 , 1 ) T \bold{p}_3=(1,0,1)^T p3=(1,0,1)T
下结论
-
满足 Λ = P − 1 A P {\bold \Lambda=\bold P^{-1}\bold {AP}} Λ=P−1AP的两个矩阵
-
P = ( 1 0 1 0 − 1 0 0 1 1 ) ; Λ = diag ( 2 , − 1 , 1 ) \bold {P}=\begin{pmatrix} 1 & 0 & 1 \cr 0 & { - 1} & 0 \cr 0 & 1 & 1 \cr \end{pmatrix}; \bold \Lambda=\text{diag}(2,-1,1) P= 1000−11101 ;Λ=diag(2,−1,1)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2022-10-17 PT_基本概率公式(减法/加法/乘法/除法(条件概率)/全概率/贝叶斯)@条件概率链式法则@乘法法则
2021-10-17 windows terminal_powershell/cmd_主题和背景配色/浅色主题改进/图片背景