矩阵的迹——性质及运算

最近看论文时遇到很多有关矩阵迹的相关运算,故在网上搜索了不少相关资料,将其整理为此文。包含矩阵的迹相关的概念、性质和运算(如求导);此外还包含共轭转置对矩阵的求导——将矩阵本身和其共轭转置当作两个无关的变量即可。

修改记录:
2024/03/14

  • 修正了复数矩阵中带共轭的求导公式
  • 增加了常用矩阵求导公式表格(来自《Complex-Valued Matrix Derivatives》)

一、定义

矩阵的迹是指:一个 n×n 矩阵 A​ 主对角线上各元素的和。即

tr(A)=i=1naii

显然,只有方阵才有迹

二、迹的性质

  1. tr(a)=a

    即:标量的迹就是其本身。在标量对矩阵或向量求导中应用较多。

  2. tr(A)=tr(AT)

    即:矩阵的迹等于其转置的迹。

    证明:矩阵转置不改变主对角线元素。

  3. tr(A+B)=tr(A)+tr(B)

  4. tr(AB)=tr(BA)

    证明:

    tr(AB)=i=1n(AB)ii=i=1nj=1maijbji=j=1mi=1nbjiaij=j=1m(BA)jj=tr(BA)

  5. tr(ABC)=tr(CAB)=tr(BCA)

    即:连乘矩阵的迹,循环交换位置后,迹不变。

    证明:这是 tr(AB)=tr(BA) 的推广。

    tr(ABC)=tr((AB)C)=tr(CAB)

  6. tr((AB)TC)=tr((A)T(BC))

    矩阵乘法和迹交换,其中 是哈德玛积,即对应元素之积。

  7. tr(A)=k=1nλk

    即:矩阵的迹等于矩阵特征值之和

    证明:可参考文章为什么特征值之和会等于矩阵的迹?

  8. A=αβT,则 tr(A)=tr(αβT)=αTβ=βTα

    其中,αβ 都是列向量。

  9. tr(xTAx)=tr(AxxT)=xTAx

    即:二次型的迹就是其本身。其中,x 是列向量。因为二次型是一个 1×1 的矩阵。

三、矩阵的迹对矩阵求导

  1. tr(X)X=I

    证明:

    tr(X)X=[i=1nxiix11i=1nxiix12i=1nxiix1ni=1nxiix22i=1nxiixnn]=I

  2. tr(g(X))X=g(X)

  3. tr(AX)X=tr(XA)X=AT

    证明:

    由于

    tr(AX)=i=1nj=1maijxji=j=1mi=1nxjiaij

    tr(AX)xij=aji ,恰好是矩阵 A 的转置对应元素,因此得证。

  4. tr(AXT)X=tr(XTA)X=A

    证明同上。

  5. tr(AXB)X=tr(XBA)X=(BA)T=ATBT

    证明:把矩阵 BA 当作整体再利用上面的定理即可。

  6. tr(AXBXT)X=AXB+ATXBT

    证明:分步求导。

    tr(AXBXT)X=tr(XBXTA)X+tr(XTAXB)X=(BXTA)T+AXB=AXB+ATXBT

四、含共轭的迹求导

  • tr(X)X=0

    将复数矩阵 X 写成实部和虚部,即 X=A+iB 。然后再分别求导即可证明。

    tr(X)X=tr(AiB)(A+iB)=tr(A)(A+iB)+tr(iB)(A+iB)=0

    即求导时,矩阵与其共轭矩阵相当于两个无关的变量。

  • tr(X)X=0

  • tr(AXH)X=0

  • tr(XHAX)X=ATX

  • 常用的矩阵求导公式

参考链接

posted @   无发可理的理发师  阅读(26185)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 推荐几款开源且免费的 .NET MAUI 组件库
· 实操Deepseek接入个人知识库
· 易语言 —— 开山篇
· Trae初体验
点击右上角即可分享
微信分享提示