【数学】矩阵论学习笔记(一)
符号约定:
-
II:单位矩阵
-
AHAH:AA 的 共轭转置
-
rankArankA:AA 的 秩
-
cond(A)cond(A):AA 的 条件数
-
Cm×nrCm×nr:秩为 rr 的复 m×nm×n 矩阵 集合
第一章 矩阵的相似变换
1.1 矩阵的特征值与特征向量
定义 11(特征值、特征向量)
-
设 A∈Cn×nA∈Cn×n,若 ∃λ∈C∃λ∈C 和 x∈Cn,x≠0x∈Cn,x≠0 使得
Ax=λxAx=λx则称 λλ 是 AA 的 特征值,xx 称为 AA 的属于 λλ 的 特征向量.
定义 22
设 A∈Cn×nA∈Cn×n,
-
称 λIn−AλIn−A 为 AA 的 特征矩阵.
-
称 det(λIn−A)=|λIn−A|det(λIn−A)=|λIn−A| 为 AA 的 特征多项式.
-
称 |λIn−A|=0|λIn−A|=0 为 AA 的 特征方程.
📝 Notations
-
AA 的特征值就是 AA 的特征方程的根;
-
nn 阶方阵 AA 在复数范围内一定有 nn 个特征值.
定义 33(矩阵的迹)
- 设 A=(aij)n×n∈Cn×nA=(aij)n×n∈Cn×n,称 a11+a22+⋯+anna11+a22+⋯+ann 为 AA 的 迹,记为 trAtrA.
定理 11
-
设 nn 阶方阵 A=(aij)n×nA=(aij)n×n 的特征值为 λ1,λ2,⋯,λnλ1,λ2,⋯,λn,则
-
λ1+λ2,⋯+λn=a11+a22+⋯+ann=trAλ1+λ2,⋯+λn=a11+a22+⋯+ann=trA.
-
n∏k=1λk=|A|⟹n∏k=1λk=|A|⟹ AA 可逆的充要条件是 AA 的特征值非零.
-
ATAT 的特征值是 λ1,λ2,…,λnλ1,λ2,…,λn
-
AHAH 的特征值是 ¯λ1,¯λ2,…,¯λn¯¯¯¯¯λ1,¯¯¯¯¯λ2,…,¯¯¯¯¯¯λn
-
定理 22
- 设 λiλi 是 A∈Cn×nA∈Cn×n 的 riri 重特征值(称 riri 为特征值 λiλi 的代数重数),对应 λiλi 有 sisi 个线性无关的特征向量(称 sisi 为特征值 λiλi 的几何重数),则 1≤si≤ri1≤si≤ri.
定义 44
-
设 f(λ)f(λ) 是 λλ 的多项式
f(λ)=asλs+as−1λs−1+⋯+a1λ+a0f(λ)=asλs+as−1λs−1+⋯+a1λ+a0对于 A∈Cn×nA∈Cn×n,规定
f(A)=asAs+as−1As−1+⋯+a1A+a0If(A)=asAs+as−1As−1+⋯+a1A+a0I称 f(A)f(A) 为矩阵 AA 的多项式.
定理 33
-
设 A∈Cn×nA∈Cn×n,AA 的 nn 个特征值为 λ1,λ2,⋯,λnλ1,λ2,⋯,λn,对应的特征向量分别为 x1,x2,⋯,xnx1,x2,⋯,xn,又设 f(λ)f(λ) 为一多项式,则 f(A)f(A) 的特征值为 f(λ1),f(λ2),⋯,f(λn)f(λ1),f(λ2),⋯,f(λn),对应的特征向量分别仍为 x1,x2,⋯,xnx1,x2,⋯,xn.
-
特别地,f(A)=0f(A)=0 时,AA 的任意特征值 λiλi 都满足 f(λi)=0f(λi)=0.
定理 44
-
设 λ1,λ2,⋯,λsλ1,λ2,⋯,λs 是方阵 AA 的互不相同的特征值,x1,x2,⋯,xsx1,x2,⋯,xs 是分别与之对应的特征向量,则 x1,x2,⋯,xsx1,x2,⋯,xs 线性无关.
-
特别地,属于实对称阵的不同特征值的特征向量是正交的.
1.2 矩阵的相似对角化
定义 11
-
设 A,B∈Cn×nA,B∈Cn×n,若 ∃P∈Cn×n∃P∈Cn×n 使得 P−1AP=BP−1AP=B,则称 AA 和 BB 相似,记为 A∼BA∼B;并称可逆阵 PP 为把 AA 变成 BB 的 相似变换矩阵.
-
当 AA 与对角阵相似时,称 AA 可对角化.
定理 11(性质)
-
设 A,B,C∈Cn×nA,B,C∈Cn×n,则
-
反身性:A∼AA∼A
-
对称性:若 A∼BA∼B,则 B∼AB∼A.
-
传递性:若 A∼B,B∼CA∼B,B∼C,则 A∼CA∼C.
-
-
相似关系为等价关系.
定理 22
-
设 A,B∈Cn×n,A∼BA,B∈Cn×n,A∼B,f(λ)f(λ) 是一多项式,则
-
rank(A)=rank(B)rank(A)=rank(B),|A|=|B||A|=|B|;
-
det(λI−A)=det(λI−B)det(λI−A)=det(λI−B),即 AA 与 BB 有相同的特征多项式,从而有相同的特征值.
-
A−1∼B−1,AT∼BT,f(A)∼f(B)A−1∼B−1,AT∼BT,f(A)∼f(B).
-
定理 33
-
设 A∈Cn×nA∈Cn×n,则 AA 可对角化的充分必要条件是 AA 有 nn 个线性无关的特征向量 ξ1,ξ2,⋯,ξnξ1,ξ2,⋯,ξn.
-
推论:设 A∈Cn×nA∈Cn×n,如果 AA 有 nn 个不同的特征值,则 AA 可对角化.
定理 44
- 设 λ1,λ2,⋯,λsλ1,λ2,⋯,λs 是 nn 阶方阵 AA 的所有互不相同的特征值,其重数分别为 r1,r2,⋯,rsr1,r2,⋯,rs. 则 AA 可对角化的充要条件是 riri 重特征值 λiλi 有 ri(i=1,⋯,s)ri(i=1,⋯,s) 个线性无关的特征向量.
求解一阶线性常系数微分方程组
1.3 矩阵的 Jordan 标准形
定义 11
-
形如
Ji=(λi1λi⋱⋱1λi)ri×riJi=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λi1λi⋱⋱1λi⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠ri×ri的矩阵称为 riri 阶 Jordan 块.
-
由若干个 Jordan 块构成的分块对角阵
J=(J1J2⋱Js)J=⎛⎜ ⎜ ⎜ ⎜ ⎜⎝J1J2⋱Js⎞⎟ ⎟ ⎟ ⎟ ⎟⎠称为 Jordan 矩阵.
定理 11
-
对于 riri 阶 Jordan 块
Ji=(λi1λi⋱⋱1λi)ri×riJi=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λi1λi⋱⋱1λi⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠ri×ri有
Jki=(λkiC1kλk−1iC2kλk−2i⋯Cri−1kλk−ri+1iλkiC1kλk−1i⋯Cri−2kλk−ri+2i⋱⋱⋮⋱C1kλk−1iλki)=(λk11!(λk)′12!(λk)′′⋯1(ri−1)!(λk)(ri−1)λk11!(λk)′⋯1(ri−2)!(λk)(ri−2)⋱⋱⋮⋱11!(λk)′λk)|λ=λiJki=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λkiC1kλk−1iC2kλk−2i⋯Cri−1kλk−ri+1iλkiC1kλk−1i⋯Cri−2kλk−ri+2i⋱⋱⋮⋱C1kλk−1iλki⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λk11!(λk)′12!(λk)′′⋯1(ri−1)!(λk)(ri−1)λk11!(λk)′⋯1(ri−2)!(λk)(ri−2)⋱⋱⋮⋱11!(λk)′λk⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠∣∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣ ∣∣λ=λi
对于 Jordan 阵
有
定理 22
-
设 A∈Cn×nA∈Cn×n,则 AA 与一个 Jordan 矩阵 JJ 相似,即存在可逆矩阵 P∈Cn×nnP∈Cn×nn,使得
P−1AP=JP−1AP=J这个 Jordan 矩阵 JJ 除 Jordan 块的排列次序外由 AA 唯一确定,并称 JJ 为 AA 的 Jordan 标准形.
λλ 矩阵的初等变换包括:
-
交换两行(列);
-
某一行(列)同乘以一个非零常数;
-
某一行(列)同乘以多项式 φ(λ)φ(λ) 加到另一行(列).
定理 33
-
设 A∈Cn×nA∈Cn×n,则 λIn−AλIn−A 经过初等变换可化为如下 Smith 标准形
S(λ)=(d1(λ)d2(λ)⋱dn(λ))S(λ)=⎛⎜ ⎜ ⎜ ⎜ ⎜⎝d1(λ)d2(λ)⋱dn(λ)⎞⎟ ⎟ ⎟ ⎟ ⎟⎠其中 di(λ)di(λ) 是首一多项式(最高次项系数为 11 的多项式),i=1,2,⋯,ni=1,2,⋯,n,且 di(λ)∣di+1(λ),i=1,2,⋯,n−1di(λ)∣di+1(λ),i=1,2,⋯,n−1. di(λ)di(λ) 称为 AA 的 不变因子.
由 初等变换求矩阵 AA 的 Jordan 标准形 的方法:
-
用初等变换化特征矩阵 λIn−AλIn−A 为 Smith 标准形,求出 AA 的不变因子 d1(λ),d2(λ),⋯,dn(λ)d1(λ),d2(λ),⋯,dn(λ).
-
将 AA 的每个次数大于零的不变因子 di(λ)di(λ) 分解为互不相同的一次因式方幂的乘积,这些一次因式的方幂称为 AA 的 初等因子. 设 AA 的全部初等因子为:
(λ−λ1)r1,(λ−λ2)r2,⋯,(λ−λs)rs(λ−λ1)r1,(λ−λ2)r2,⋯,(λ−λs)rs其中 λ1,λ2,⋯,λsλ1,λ2,⋯,λs 可能有相同的值,且 r1+r2+⋯+rs=nr1+r2+⋯+rs=n.
-
写出每个初等因子 (λ−λi)ri,i=1,2,⋯,s(λ−λi)ri,i=1,2,⋯,s 对应的 Jordan 块
Ji=(λi1λi⋱⋱1λi)ri×ri(i=1,2,⋯,s)Ji=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λi1λi⋱⋱1λi⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠ri×ri(i=1,2,⋯,s)以这些 Jodan 块构成的 Jordan 阵
J=(J1J2⋱Js)J=⎛⎜ ⎜ ⎜ ⎜ ⎜⎝J1J2⋱Js⎞⎟ ⎟ ⎟ ⎟ ⎟⎠即为 AA 的 Jordan 标准形.
定义 22
- 设 A∈Cm×nA∈Cm×n,λIn−AλIn−A 的所有 kk 阶子式 首一最大公因式 Dk(λ)Dk(λ) 称为 AA 的 kk 阶行列式因子,k=1,2,⋯,nk=1,2,⋯,n.
定理 44
-
设 A∈Cm×nA∈Cm×n,Dk(λ)Dk(λ) 是 AA 的 kk 阶行列式因子,dk(λ)dk(λ) 是 AA 的不变因子,k=1,2,⋯,nk=1,2,⋯,n,则
d1(λ)=D1(λ)dk(λ)=Dk(λ)/Dk−1(λ),k=2,3,⋯,n.d1(λ)=D1(λ)dk(λ)=Dk(λ)/Dk−1(λ),k=2,3,⋯,n.
由 行列式因子求矩阵 AA 的 Jordan 标准形 方法:
-
求 λIn−AλIn−A 的 nn 个行列式因子 D1(λ),D2(λ),⋯,Dn(λ)D1(λ),D2(λ),⋯,Dn(λ)
-
由 d1(λ)=D1(λ),dk(λ)=Dk(λ)/Dk−1(λ)d1(λ)=D1(λ),dk(λ)=Dk(λ)/Dk−1(λ),求 AA 的不变因子.
-
求 AA 的初等因子和 Jordan 标准形.
1.4 Hamilton-Cayley 定理
定理 11(Hamilton-Cayley 定理)
- 设 A∈Cn×nA∈Cn×n,φ(λ)=det(λIn−A)φ(λ)=det(λIn−A),则 φ(A)=Oφ(A)=O.
📝 Notations
-
利用定理 11 可以简化矩阵运算.
-
可逆矩阵逆的多项式表示:设 A∈Cn×nA∈Cn×n,
φ(λ)=|λIn−A|=λn+a1λn−1+⋯+an−1λ+anφ(λ)=|λIn−A|=λn+a1λn−1+⋯+an−1λ+an若 detA≠0detA≠0(AA 可逆),则
A−1=−1an(An−1+a1An−2+⋯+an−1I)A−1=−1an(An−1+a1An−2+⋯+an−1I)
定义 11(零化多项式)
- 设 A∈Cn×nA∈Cn×n,f(λ)f(λ) 是多项式,如果 f(A)=Of(A)=O,则称 f(λ)f(λ) 为 AA 的 零化多项式.
定义 22(最小多项式)
- 设 A∈Cn×nA∈Cn×n,在 AA 的零化多项式中,次数最低的首一多项式,称为 AA 的 最小多项式,记为 mA(λ)mA(λ).
定理 22
-
设 A∈Cn×nA∈Cn×n,φ(λ)=det(λIn−A)φ(λ)=det(λIn−A),又设 Dn−1(λ)Dn−1(λ) 是 λIn−AλIn−A 的 n−1n−1 阶行列式因子,则
mA(λ)=φ(λ)Dn−1(λ)mA(λ)=φ(λ)Dn−1(λ)
定理 33
- 设 A∈Cn×nA∈Cn×n,则 AA 的最小多项式 mA(λ)mA(λ) 能整除 AA 的任一零化多项式,且最小多项式是唯一的.
定理 44
-
设 A∈Cn×nA∈Cn×n,λ1,λ2,⋯,λsλ1,λ2,⋯,λs 是 AA 的所有互不相同的特征值,则
mA(λ)=(λ−λ1)m1(λ−λ2)m2mA(λ)=(λ−λ1)m1(λ−λ2)m2其中,mimi 是 AA 的 Jordan 标准形 JJ 中含 λiλi 的 Jordan 块的最高阶数
1.5 向量的内积
定义 11(向量的内积)
-
设 x=(x1,x2,⋯,xn)T∈Cnx=(x1,x2,⋯,xn)T∈Cn,y=(y1,y2,⋯,yn)T∈Cny=(y1,y2,⋯,yn)T∈Cn,令
(x,y)=n∑i=1xi¯yi=yHx(x,y)=n∑i=1xi¯¯¯¯yi=yHx称 (x,y)(x,y) 为 xx 与 yy 的 内积.(这里,yH=(¯y1,¯y2,⋯,¯yn)∈C1×nyH=(¯¯¯¯¯y1,¯¯¯¯¯y2,⋯,¯¯¯¯¯yn)∈C1×n)
定理 11
-
设 x,y,z∈Cnx,y,z∈Cn,λ∈Cλ∈C,则
-
酉对称性:
(x,y)=¯(y,x)(x,y)=¯¯¯¯¯¯¯¯¯¯¯¯¯(y,x) -
单线性性:
(x+y,z)=(x,z)+(y,z)(λx,y)=λ(x,y),(x,λy)=¯λ(x,y)(x+y,z)=(x,z)+(y,z)(λx,y)=λ(x,y),(x,λy)=¯¯¯λ(x,y) -
正定性:
(x,x)≥0(x,x)≥0当且仅当 x=0x=0 时,有 (x,x)=0(x,x)=0.
-
定义 22
-
设 x=(x1,x2,⋯,xn)T∈Cnx=(x1,x2,⋯,xn)T∈Cn,令
‖x‖=√(x,x)=√n∑i=1|xi|2=√xHx∥x∥=√(x,x)= ⎷n∑i=1|xi|2=√xHx称 ‖x‖∥x∥ 为向量 xx 的 长度 或 22 - 范数.
定理 22
-
设 x,y∈Cnx,y∈Cn,λ∈Cλ∈C,则
-
非负性:当 x≠0x≠0 时,‖x‖>0∥x∥>0;当 x=0x=0 时,‖x‖=0∥x∥=0;
-
齐次性:
‖λx‖=|λ|‖x‖∥λx∥=|λ|∥x∥- 三角不等式:
‖x+y‖≤‖x‖+‖y‖∥x+y∥≤∥x∥+∥y∥ -
定理 33(Cauchy-Schwarz 不等式)
-
对任意 x,y∈Cnx,y∈Cn,有
|(x,y)|≤‖x‖‖y‖|(x,y)|≤∥x∥∥y∥即
(x,y)(y,x)≤(x,x)(y,y)(x,y)(y,x)≤(x,x)(y,y)
定义 33
- 设 x,y∈Cnx,y∈Cn,若 (x,y)=0(x,y)=0,则称 xx 与 yy 正交,记作 x⊥yx⊥y.
定理 44
- CnCn 中两两正交的非零向量组线性无关.
定义 44
-
设 x1,x2,⋯,xnx1,x2,⋯,xn 是 CnCn 的一组基,若
(xi,xj)=δij={0,i≠j,1,i=j.(xi,xj)=δij={0,i≠j,1,i=j.则称 x1,x2,⋯,xnx1,x2,⋯,xn 是 CnCn 空间中的一组 标准正交基.
Schmidt 正交化
-
设 x1,x2,⋯,xnx1,x2,⋯,xn 是 CnCn 空间这的一组基,令
y1=x1y2=x2−(x2,y1)(y1,y1)y1y3=x3−(x3,y1)(y1,y1)y1−(x3,y2)(y2,y2)y2⋯yn=xn−(xn,y1)(y1,y1)y1−(xn,y2)(y2,y2)y2−⋯−(xn,yn−1)(yn−1,yn−1)yn−1y1=x1y2=x2−(x2,y1)(y1,y1)y1y3=x3−(x3,y1)(y1,y1)y1−(x3,y2)(y2,y2)y2⋯yn=xn−(xn,y1)(y1,y1)y1−(xn,y2)(y2,y2)y2−⋯−(xn,yn−1)(yn−1,yn−1)yn−1此时,y1,y2,⋯,yny1,y2,⋯,yn 两两正交(再进行单位化,即可得到一组标准正交基).
定义 55(酉矩阵)
-
设 A∈Cn×nA∈Cn×n,若 AA 满足
AHA=AAH=IAHA=AAH=I则称 AA 为 酉矩阵.
📝 Notations
-
设 A∈Cn×nA∈Cn×n,则
AHA=AAH=I⟺AHA=I⟺AAH=I⟺A−1=AHAHA=AAH=I⟺AHA=I⟺AAH=I⟺A−1=AH -
当 A∈Rn×nA∈Rn×n 时,酉矩阵就是正交矩阵.
定理 55
-
设 A∈Cn×nA∈Cn×n 是酉矩阵,则
-
|detA|=1|detA|=1;
-
AT,AH,A−1AT,AH,A−1 仍为酉矩阵;
-
若 B∈Cn×nB∈Cn×n 是酉矩阵,则 ABAB 也是酉矩阵.
-
定理 66
- 设 A=(x1,x2,⋯,xn)∈Cn×nA=(x1,x2,⋯,xn)∈Cn×n,则 AA 是酉矩阵的充要条件是 x1,x2,⋯,xnx1,x2,⋯,xn 是 CnCn 中的一组标准正交基.
1.6 矩阵的酉相似
定义 11(酉相似)
-
设 A,B∈Cn×nA,B∈Cn×n,若存在酉矩阵 UU 使得
U−1AU=UHAU=BU−1AU=UHAU=B则称 AA 和 BB 酉相似.
定理 11(Schur 分解定理)
-
设 A∈Cn×nA∈Cn×n,则 AA 可酉相似于 上三角矩阵 TT,即存在 nn 阶酉矩阵 UU,使得
U−1AU=UHAU=T=(λ1∗⋯∗λ2⋱⋮⋱∗λn)U−1AU=UHAU=T=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝λ1∗⋯∗λ2⋱⋮⋱∗λn⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠其中 λ1,λ2,⋯,λnλ1,λ2,⋯,λn 是 AA 的特征值.
定义 22(正规矩阵)
-
设 A∈Cn×nA∈Cn×n,若 AA 满足
AHA=AAHAHA=AAH则称 AA 为 正规矩阵.
📝 Notations(正规矩阵的例子)
-
实对称阵:A∈Rn×n,AT=AA∈Rn×n,AT=A;
-
实反对称阵:A∈Rn×n,AT=−AA∈Rn×n,AT=−A;
-
实正交矩阵:A∈Rn×n,ATA=AAT=IA∈Rn×n,ATA=AAT=I;
-
Hermite 矩阵:A∈Cn×n,AH=AA∈Cn×n,AH=A;
-
反 Hermite 矩阵:A∈Cn×n,AH=−AA∈Cn×n,AH=−A;
-
酉矩阵:A∈Cn×n,AHA=AAH=IA∈Cn×n,AHA=AAH=I.
定理 22
-
设 A∈Cn×nA∈Cn×n,则 AA 可以酉相似对角化的充要条件是
AHA=AAHAHA=AAH即 AA 为正规矩阵.
定理 33
-
设 A∈Cn×nA∈Cn×n 是正规矩阵,则
-
AA 是 Hermite 矩阵 ⟺⟺ AA 的特征值全是实数;
-
AA 是反 Hermite 矩阵 ⟺⟺ AA 的特征值是 00 或纯虚数;
-
AA 是酉矩阵 ⟺⟺ AA 的特征值的模是 11;
-
λλ 是 AA 的特征值,xx 是对应 λλ 的特征向量,则 ¯λ¯¯¯λ 是 AHAH 的特征值,对应 ¯λ¯¯¯λ 的特征向量仍为 xx.
-
酉相似对角化方法:
-
求出 AA 的全部特征值,设 λ1,λ2,⋯,λsλ1,λ2,⋯,λs 是 AA 的互不相同的特征值,其重数分别为 r1,r2,⋯,rsr1,r2,⋯,rs,且 r1+r2+⋯+rs=nr1+r2+⋯+rs=n.
-
对于特征值 λi,i=1,2,⋯,sλi,i=1,2,⋯,s,求出对应的 riri 个线性无关的特征向量 pi1,pi2,⋯,piri,i=1,2,⋯,spi1,pi2,⋯,piri,i=1,2,⋯,s.
-
用 Schmidt 正交化方法将 pi1,pi2,⋯,piripi1,pi2,⋯,piri 正交化再单位化得 ui1,ui2,⋯,uiri,i=1,2,⋯,sui1,ui2,⋯,uiri,i=1,2,⋯,s,则酉矩阵
U=(u11,⋯,u1r1,u21,⋯,u2r2,⋯,us1,⋯,usrs,)U−1AU=UHAU=Λ=(λ1Ir1λ2Ir2⋱λsIrs)U=(u11,⋯,u1r1,u21,⋯,u2r2,⋯,us1,⋯,usrs,)U−1AU=UHAU=Λ=⎛⎜ ⎜ ⎜ ⎜ ⎜⎝λ1Ir1λ2Ir2⋱λsIrs⎞⎟ ⎟ ⎟ ⎟ ⎟⎠
定义 33
-
设 A∈Cn×nA∈Cn×n 是一个 Hermite 矩阵,如果
xHAx>0,∀x∈Cn,x≠0xHAx>0,∀x∈Cn,x≠0则称 AA 是一个 正定 的 Hermite 矩阵.
如果
xHAx≥0,∀x∈CnxHAx≥0,∀x∈Cn则称 AA 是一个 非负定(半正定)的 Hermite 矩阵.
定理 44(正定 Hermite 矩阵的性质)
-
设 A∈Cn×nA∈Cn×n 是 Hermite 矩阵,则下述条件等价:
-
AA 是正定的 Hermite 矩阵;
-
AA 的特征值全为正数;
-
存在可逆矩阵 PP,使得 A=PHPA=PHP;
-
AA 的顺序主子式全为正数.
-
定理 55(非负定 Hermite 矩阵的性质)
-
设 A∈Cn×nA∈Cn×n 是 Hermite 矩阵,则下述条件等价:
-
AA 是非负定的 Hermite 矩阵;
-
AA 的特征值全为非负数;
-
存在矩阵 PP,使得 A=PHPA=PHP.
-
定理 66
-
设 A∈Cn×nA∈Cn×n,则
-
AHAAHA 和 AAHAAH 的特征值全为非负实数;
-
AHAAHA 和 AAHAAH 的非零特征值相同;
-
rank(AHA)=rank(AAH)=rank(A)rank(AHA)=rank(AAH)=rank(A).
-
第二章 范数理论
2.1 向量的范数
定义 11(向量范数)
-
设 ‖⋅‖∥⋅∥ 是 CnCn 上一个泛函,满足
-
正定性:
∀x∈Cn,‖x‖≥0∀x∈Cn,∥x∥≥0且 ‖x‖=0∥x∥=0 当且仅当 x=0x=0.
-
齐次性:
∀λ∈C,x∈Cn,‖λx‖=|λ|⋅‖x‖∀λ∈C,x∈Cn,∥λx∥=|λ|⋅∥x∥ -
三角不等式:
∀x,y∈Cn,‖x+y‖≤‖x‖+‖y‖∀x,y∈Cn,∥x+y∥≤∥x∥+∥y∥则称 ‖⋅‖∥⋅∥ 是 CnCn 上的一个 向量范数.
-
定理 11
-
对任意 x,y∈Cnx,y∈Cn,有
-
‖x‖=‖−x‖∥x∥=∥−x∥
-
|‖x‖−‖y‖|≤‖x−y‖∣∣∥x∥−∥y∥∣∣≤∥x−y∥
-
定义 22
-
设 x=(x1,x2,…,xn)T∈Cnx=(x1,x2,…,xn)T∈Cn,定义
‖x‖1=n∑i=1|xi|‖x‖2=(n∑i=1|xi|2)12‖x‖p=(n∑i=1|xi|p)1p,1≤p<+∞‖x‖∞=max1≤i≤n|xi|∥x∥1=n∑i=1|xi|∥x∥2=(n∑i=1|xi|2)12∥x∥p=(n∑i=1|xi|p)1p,1≤p<+∞∥x∥∞=max1≤i≤n|xi|可以验证 ‖⋅‖1,‖⋅‖2,‖⋅‖p,‖⋅‖∞∥⋅∥1,∥⋅∥2,∥⋅∥p,∥⋅∥∞ 均是 CnCn 上的向量范数,分别称为 11 - 范数,22 - 范数,pp - 范数 和 ∞∞ - 范数.
Hölder 不等式
-
对任意 xi,yi∈C,i=1,2,…,nxi,yi∈C,i=1,2,…,n,有
n∑i=1|xiyi|≤(n∑i=1|xi|p)1p(n∑i=1|yi|q)1qn∑i=1|xiyi|≤(n∑i=1|xi|p)1p(n∑i=1|yi|q)1q其中 1≤p,q≤+∞1≤p,q≤+∞ 且 1p+1q=11p+1q=1.
Minkowski 不等式(pp - 范数的三角不等式)
-
对任意 xi,yi∈C,i=1,2,…,nxi,yi∈C,i=1,2,…,n,有
(n∑i=1|xi+yi|p)1p≤(n∑i=1|xi|p)1p+(n∑i=1|yi|p)1p(n∑i=1|xi+yi|p)1p≤(n∑i=1|xi|p)1p+(n∑i=1|yi|p)1p其中 1≤p<+∞1≤p<+∞.
定理 22
- ∀x∈Cn,limp→∞‖x‖p=‖x‖∞∀x∈Cn,limp→∞∥x∥p=∥x∥∞.
📝 Notations
- 如果 A∈Cn×nA∈Cn×n 是 Hermite 正定矩阵,则 ‖x‖A=√xHAx,x∈Cn∥x∥A=√xHAx,x∈Cn 也是 CnCn 上的向量范数.
定义 33
-
设 ‖⋅‖v1∥⋅∥v1 与 ‖⋅‖v2∥⋅∥v2 是 CnCn 上两个向量范数,如果存在常数 c1,c2>0c1,c2>0,使得
∀x∈Cn,c1‖x‖v1≤‖x‖v2≤c2‖x‖v1∀x∈Cn,c1∥x∥v1≤∥x∥v2≤c2∥x∥v1则称向量范数 ‖⋅‖v1∥⋅∥v1 和 ‖⋅‖v2∥⋅∥v2 等价.
向量范数的等价是 等价关系:
-
自反性:所有范数与自己等价.
-
对称性:若向量范数 ‖⋅‖v1∥⋅∥v1 与 ‖⋅‖v2∥⋅∥v2 等价,则向量范数 ‖⋅‖v2∥⋅∥v2 与 ‖⋅‖v1∥⋅∥v1 等价.
-
传递性:若向量范数 ‖⋅‖v1∥⋅∥v1 与 ‖⋅‖v2∥⋅∥v2 等价,且向量范数 ‖⋅‖v2∥⋅∥v2 与 ‖⋅‖v3∥⋅∥v3 等价,则向量范数 ‖⋅‖v1∥⋅∥v1 与 ‖⋅‖v3∥⋅∥v3 等价.
定理 33
- CnCn 上所有向量范数等价.
定义 44
-
设 x(k)=(x(k)1,x(k)2,…,x(k)n)T∈Cnx(k)=(x(k)1,x(k)2,…,x(k)n)T∈Cn,k=1,2,…k=1,2,… 是一个向量序列,如果
limk→∞x(k)i=xi,i=1,2,…,nlimk→∞x(k)i=xi,i=1,2,…,n则称向量序列 {x(k)}{x(k)} 收敛于 x=(x1,x2,…,xn)Tx=(x1,x2,…,xn)T,记为
limk→∞x(k)=xlimk→∞x(k)=x否则,称 {x(k)}{x(k)} 发散.
定理 44
-
limk→∞x(k)=x⟺limk→∞‖x(k)−x‖=0limk→∞x(k)=x⟺limk→∞∥x(k)−x∥=0
其中,‖⋅‖∥⋅∥ 是 CnCn 上任一向量范数.
2.2 矩阵范数
定义 11(矩阵范数)
-
设 ‖⋅‖∥⋅∥ 是 Cn×nCn×n 上的一个泛函,满足
-
正定性:
∀A∈Cn×n,‖A‖≥0∀A∈Cn×n,∥A∥≥0其中 ‖A‖=0∥A∥=0 当且仅当 A=OA=O.
-
齐次性:
∀λ∈C,A∈Cn×n,‖λA‖=|λ|‖A‖∀λ∈C,A∈Cn×n,∥λA∥=|λ|∥A∥ -
三角不等式:
∀A,B∈Cn×n,‖A+B‖≤‖A‖+‖B‖∀A,B∈Cn×n,∥A+B∥≤∥A∥+∥B∥ -
乘积不等式(相容性):
∀A,B∈Cn×n,‖AB‖≤‖A‖⋅‖B‖∀A,B∈Cn×n,∥AB∥≤∥A∥⋅∥B∥
则称 ‖⋅‖∥⋅∥ 是 Cn×nCn×n 上的一个 矩阵范数.
-
定义 22
-
设 A=(aij)∈Cn×nA=(aij)∈Cn×n,定义
-
m1m1 - 范数:
‖A‖m1=n∑i=1n∑j=1|aij|∥A∥m1=n∑i=1n∑j=1|aij| -
FF - 范数:
‖A‖F=(n∑i=1n∑j=1|aij|2)12=√tr(AAH)∥A∥F=(n∑i=1n∑j=1|aij|2)12=√tr(AAH) -
m∞m∞ - 范数:
‖A‖m∞=n⋅max1≤i,j≤n|aij|∥A∥m∞=n⋅max1≤i,j≤n|aij|
-
定义 33
-
设 ‖⋅‖m∥⋅∥m 是 Cn×nCn×n 上的矩阵范数,‖⋅‖v∥⋅∥v 是 CnCn 上的向量范数,如果对任意 A∈Cn×nA∈Cn×n,x∈Cnx∈Cn,
‖Ax‖v≤‖A‖m⋅‖x‖v∥Ax∥v≤∥A∥m⋅∥x∥v则称矩阵范数 ‖⋅‖m∥⋅∥m 与向量范数 ‖⋅‖v∥⋅∥v 相容.
定理 11
-
矩阵范数 ‖⋅‖m1,‖⋅‖F∥⋅∥m1,∥⋅∥F 分别与 ‖⋅‖1,‖⋅‖2∥⋅∥1,∥⋅∥2 相容;
-
矩阵范数 ‖⋅‖m∞∥⋅∥m∞ 与向量范数 ‖⋅‖1,‖⋅‖2,‖⋅‖∞∥⋅∥1,∥⋅∥2,∥⋅∥∞ 相容.
定义 44(由矩阵范数诱导的向量范数)
-
设 ‖⋅‖m∥⋅∥m 是 Cn×nCn×n 上的一个矩阵范数,取 a∈Cna∈Cn,且 a≠0a≠0. 定义
‖x‖v=‖xaH‖m,x∈Cn∥x∥v=∥xaH∥m,x∈Cn可以证明,它是 CnCn 上的向量范数,称为由矩阵范数 ‖⋅‖m∥⋅∥m 所 诱导的 向量范数.
定理 22
- Cn×nCn×n 是任意一矩阵范数 ‖⋅‖m∥⋅∥m 与它所诱导的向量范数 ‖⋅‖v∥⋅∥v 相容.
定义 55(由向量范数诱导的矩阵范数)
-
设 ‖⋅‖v∥⋅∥v 是 CnCn 上一个向量范数,定义
‖A‖m=max‖x‖v=1‖Ax‖v=maxx≠0‖Ax‖v‖x‖v,A∈Cn×n∥A∥m=max∥x∥v=1∥Ax∥v=maxx≠0∥Ax∥v∥x∥v,A∈Cn×n可以证明(下面的定理 33),它是 Cn×nCn×n 上的矩阵范数,称为由向量范数 ‖⋅‖v∥⋅∥v 诱导的 矩阵范数,简称 从属范数.
定理 33
- 设 ‖⋅‖v∥⋅∥v 是 CnCn 上任一向量范数,则它所诱导的 ‖⋅‖m∥⋅∥m 为一个矩阵范数且与其相容.
定理 44
-
设 A=(aij)n×n∈Cn×nA=(aij)n×n∈Cn×n,记由向量 11,22,∞∞ 范数导出的矩阵范数分别为 ‖A‖1∥A∥1,‖A‖2∥A∥2,‖A‖∞∥A∥∞,则有
‖A‖1=maxjn∑i=1|aij|‖A‖2=√λ1‖A‖∞=maxin∑j=1|aij|∥A∥1=maxjn∑i=1|aij|∥A∥2=√λ1∥A∥∞=maxin∑j=1|aij|其中,λ1λ1 是 AHAAHA 的最大特征值.
分别称 ‖A‖1∥A∥1,‖A‖2∥A∥2 和 ‖A‖∞∥A∥∞ 为矩阵的 11 - 范数,22 - 范数 和 ∞∞ - 范数.
定理 55
-
设 A∈Cn×nA∈Cn×n,则
-
‖AH‖F=‖A‖F∥AH∥F=∥A∥F,‖AH‖2=‖A‖2∥AH∥2=∥A∥2
-
酉不变性:对任意酉矩阵 U,V∈Cn×nU,V∈Cn×n,有
‖UA‖F=‖AV‖F=‖UAV‖F‖UA‖2=‖AV‖2=‖UAV‖2∥UA∥F=∥AV∥F=∥UAV∥F∥UA∥2=∥AV∥2=∥UAV∥2 -
若 AA 是正规矩阵,且 λ1,λ2,…,λnλ1,λ2,…,λn 是 AA 的 nn 个特征值,则
‖A‖2=maxk|λk|∥A∥2=maxk|λk|
-
定理 66
- Cn×nCn×n 上所有矩阵范数等价.
长方阵的范数
对方阵范数的定义稍作修改可以推广到 m×nm×n 矩阵的情形:
-
矩阵范数的 相容性:对任意 A∈Cm×nA∈Cm×n,B∈Cn×lB∈Cn×l 有
‖AB‖≤‖A‖⋅‖B‖∥AB∥≤∥A∥⋅∥B∥ -
矩阵范数 与向量范数的相容性:对任意 A∈Cm×nA∈Cm×n,x∈Cnx∈Cn 有
‖Ax‖≤‖A‖⋅‖x‖∥Ax∥≤∥A∥⋅∥x∥ -
从属范数:
‖A‖=max‖x‖v=1‖Ax‖v=maxx≠0‖Ax‖v‖x‖v,A∈Cm×n∥A∥=max∥x∥v=1∥Ax∥v=maxx≠0∥Ax∥v∥x∥v,A∈Cm×n其中 ‖Ax‖v 是 Cm 上的范数,‖x‖v 是 Cn 上的范数,它们应取为同类的向量范数.
常用矩阵范数
设 A∈Cm×n,
-
m1 范数:
‖A‖m1=m∑i=1n∑j=1|aij| -
F 范数:
‖A‖F=√m∑i=1n∑j=1|aij|2=√tr(AHA) -
M 范数(最大范数):
‖A‖M=max{m,n}maxi,j|aij| -
G 范数(几何平均范数):
‖A‖G=√nmmaxi,j|aij| -
1 范数(列和范数)
‖A‖1=maxjm∑i=1|aij| -
2 范数(谱范数)
‖A‖2=√AHA的最大特征值 -
∞ 范数(行和范数)
‖A‖∞=maxin∑j=1|aij| -
矩阵范数的性质:
-
F 范数和 2 范数是 酉不变 的.
-
m1 范数与向量 1 范数相容;
F 范数、G 范数与向量 2 范数相容;
M 范数与向量 1,2,∞ 范数相容.
-
矩阵的 1,2,∞ 范数分别由向量 1,2,∞ 范数导出,从而相容.
-
Cm×n 上所有矩阵范数 等价.
-
2.3 范数应用举例
定义 1(矩阵的谱半径)
-
设 A∈Cn×n,λ1,λ2,…,λn 是 A 的特征值,则称
ρ(A)=max1≤i≤n|λi|为矩阵 A 的 谱半径.
定理 1
-
设 A∈Cn×n,则
-
ρ(AH)=ρ(AT)=ρ(A)
-
ρ(Ak)=[ρ(A)]k
-
当 A 是正规矩阵时,ρ(A)=‖A‖2
-
定理 2
- ρ(A)≤‖A‖,其中 ‖A‖ 是 A 的任一矩阵范数.
定理 3
-
设 A∈Cn×n,则 ∀ε>0,必存在 Cn×n 上的矩阵范数 ‖⋅‖m,使得
‖A‖m≤ρ(A)+ε
引理
- 设 P∈Cn×n,若对 Cn×n 上的某一矩阵范数 ‖⋅‖,有 ‖P‖<1,则 I−P 可逆.
定理 4
-
设 A∈Cn×nn,δA∈Cn×n. 若对 Cn×n 上的某一矩阵范数 ‖⋅‖,有 ‖A−1δA‖<1 ,则
-
A+δA 可逆;
-
‖(A+δA)−1‖≤‖A−1‖1−‖A−1δA‖
-
‖A−1−(A+δA)−1‖‖A−1‖≤‖A−1δA‖1−‖A−1δA‖
-
定义 2(条件数)
-
设 A∈Cn×nn,‖⋅‖ 是 Cn×n 上的某一矩阵范数,称
cond(A)=‖A‖‖A−1‖为矩阵 A 的 条件数(condition number).
推论
-
设 A∈Cn×nn,δA∈Cn×n,若对 Cn×n 上的某一矩阵范数 ‖⋅‖,有 ‖A−1‖‖δA‖<1 ,则
‖A−1−(A+δA)−1‖‖A−1‖≤cond(A)‖δA‖‖A‖1−cond(A)‖δA‖‖A‖
定理 5
-
设 A∈Cn×nn,δA∈Cn×n,b,δb∈Cn,若对 Cn×n 上的某一矩阵范数 ‖⋅‖,有 ‖A−1‖‖δA‖<1,则非齐次线性方程组
Ax=b与
(A+δA)(x+δx)=b+δb的解满足
‖δx‖v‖x‖v≤cond(A)1−cond(A)‖δA‖‖A‖(‖δA‖‖A‖+‖δb‖v‖b‖v)其中 ‖⋅‖v 是 Cn 上与矩阵范数 ‖⋅‖ 相容的向量范数.
📝 Notations
- 如果矩阵 A 的条件数很大,则称 A 对于求逆矩阵或求解线性方程组是 病态的(坏条件的),否则,称为 良态的(好条件的).
参考资料:
-
矩阵论简明教程(第三版). 徐仲,张凯院,陆全,冷国伟 编著
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)