前言
在图像处理,模式识别中,常需要利用特定的线性变换将高维向量压缩成低维向量或者将低维向量还原为高维向量,并且使误差尽可能小,描述此类问题的数学模型时:相当于求以矩阵U为自变量的函数
J(U)=||Uα−β||,其中U∈Rm×n,α∈Rn,β∈Rm
在约束条件UTU=I,或者UUT=I的最小值点.解决此类优化问题的一个可行办法就是求矩阵函数J(U)关于未知矩阵U的导数,这就是需要研究矩阵的微积分
1.向量序列的极限
定义
定义,设x(k),x∈Cn,k=1,2,...,若
||x(k)−x||→0,k→+∞
则称向量序列{x(k)}收敛于向量x,或者说向量x是向量序列{x(k)}当k→+∞时的极限,可记为
limk→∞x(k)=x
或
x(k)→x,k→+∞
性质
- 向量序列{x(k)}收敛于x的充要条件是每一个坐标分量{x(k)i}收敛于xi,即
limk→+∞x(k)i=xi,i=1,2,...,n
2.矩阵序列的极限
定义
设有矩阵序列{A(k)},其中A(k)=(akij)∈Cn×n,且当k→∞时,a(k)ij→aij,则称{A(k)}收敛,并把矩阵A=(aij)叫做{A(k)}的极限
limk→∞A(k)=A,或,A(k)→A,k→+∞
性质
- 设limk→+∞A(k)=A,limk→+∞B(k)=B,则
limk→+∞(aA(k)+bB(k))=aA+bB
- 设limk→+∞A(k)=A,limk→+∞B(k)=B,A(k),B(k)是方阵,同阶,则
limk→+∞(A(k)B(k))=AB
- 设limk→+∞A(k)=A,且A(k)(k=1,2,...)均可逆,则{(A(k))−1}也收敛,且有
limk→+∞(A(k))−1=A−1
- 矩阵序列{A(k)},则limk→∞A(k)的充要条件是矩阵A的所有特征值的模都小于1,即A的谱半径小于1
ρ(A)<1
3.矩阵级数
定义
设有矩阵序列
A(1),A(2),...,A(k),...
其中A(k)=(a(k)ij)∈Cn×n,称无穷和
A(0)+A(1)+A(2)+...+A(k)+...
为矩阵级数,记为∞∑k=0A(1)
性质
矩阵级数+∞∑k=0=A(0)+A(1)+...+A(k)+...,其中A(k)=(a(k)ij)∈Cn×n,如果n个数项级数
a(0)ij+a(1)ij+...+a(k)ij+...
都绝对收敛,则称矩阵级数绝对收敛
补充一下,绝对收敛时指级数∑ui,收敛,并且∑|ui|也收敛
- 矩阵级数∞∑k=0A(k)绝对收敛的充要条件是∞∑k=0||A(k)||=||A0||+||A(1)||+...+||A(k)||+...收敛,其中||A(k)||是A(k)的任意一种范数
- 设两个矩阵级数
A(1)+A(2)+...+A(k)+...,A(k)∈Cn×n
B(1)+B(2)+...+B(k)+...,B(k)∈Cn×n
都绝对收敛,其和分别为A,B,则将他们按项相乘后做成的矩阵级数
A(1)B(1)+(A(1)B(2)+A(2)B(1))+...+(A(1)B(k)+A(2)B(k−1)+...+A(k)B(1))+...
绝对收敛,且具有和AB
- 设P,Q为n阶非奇异矩阵,若级数+∞∑k=0A(k)收敛(或绝对收敛),则矩阵级数+∞∑k=0PA(k)Q也收敛(或绝对收敛)
幂级数
形如
c0I+c1A+c2A2+...+ckAk+....
的级数称为矩阵幂级数,
- 矩阵幂级数I+A+A2+...+Ak+...绝对收敛的充要条件是A的谱半径ρ(A)<1,且该级数的和为(I−A)−1
4.矩阵函数
一些矩阵函数的定义
eA=I+A+A22!+...+Akk!+...
sin A=A−A33!+...+(−1)k−1A2k−1(2k−1)!+...
cos A=I−A22!+...+(−1)k−1A2k(2k)!+...
eA⋅eB=eB⋅eA=eA+B
- 对于任意方阵A,eA总是可逆的,(eA)−1=e−A
- (eA)m=emA,m为整数
- ⎧⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪⎩eiA=cosA+isinAcosA=12(eiA+e−iA)sinA=12i(eiA−e−iA)cos(−A)=cosAsin(−A)=−sinA
- 如果AB=BA,还有
⎧⎪
⎪
⎪⎨⎪
⎪
⎪⎩cos(A+B)=cosAcosB−sinAsinBcos2A=cos2A−sin2Asin(A+B)=sinAcosB+cosAsinBsin2A=2sinAcosA
矩阵函数的求法
- 先引入定理设方阵A的n个特征值为λi(i=1,2,...,n),f(z)为一多项式函数,则多项式方阵函数f(A)的n个特征值为f(λi),(i=1,2,...,n)
矩阵A非亏损的情况下
即A可以对角化
存在非奇异矩阵C,使得
C−1AC=diag(λ1,λ2,...,λn)
于是有
C−1AmC=diag(λm1,λm2,...,λmn)
C−1f(A)C=diag(f(λ1),f(λ2),...,f(λn))
若f(z)=+∞∑k=0ckzk在整个复平面上收敛,则f(A)也收敛(矩阵论定理5.2.4)
f(A)=C⋅diag(f(λ1),f(λ2),...,f(λn))⋅C−1
矩阵亏损情况下
显然这时候有若尔当标准型分解A=TJT−1
定义矩阵函数为
f(A)=T⋅f(J)⋅T−1
其中
f(J)=diag(f(J1(λ1)),f(J2(λ2)),...,f(Jr(λr)))
f(Ji(λi))=⎛⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎜⎝f(λi)f′(λi)12!f′′(λi)...1(ni−1)!f(ni−1)(λi)f(λi)f′(λi)...1(ni−2)!f(ni−2)(λi).........f′(λi)f(λi)⎞⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎟⎠
要求矩阵函数→要求若尔当标准型→要求初等因子
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)