代数基础
矩阵微分
\(X \in \mathbb{R}^{m \times n}\), \(Y \in \mathbb{R}^{n \times p}\)
定义:
\(\mathrm{d}(X+Y) = \mathrm{d}X + \mathrm{d}Y\)
根据\(\mathrm{d}(X_{ij}+Y_{ij}) = \mathrm{d}X_{ij} + \mathrm{d}Y_{ij}\)可得。
\(\mathrm{d}(XY) = (\mathrm{d}X)Y + X\mathrm{d}Y\)
\(\mathrm{d}X^T = (\mathrm{d}X)^T\)
\(\mathrm{dTr}(X)\) = \(\mathrm{Tr}(\mathrm{d}X)\)
这里假设\(X \in \mathbb{R}^{n \times n}\)
\(\mathrm{d}X^{-1} = -X^{-1}\mathrm{d}X X^{-1}\)
这里假设\(X \in \mathbb{R}^{n \times n}\),可逆。
则
对俩边同时微分可得:
所以
\(\mathrm{d}|X| = \mathrm{Tr}(X^*\mathrm{d}X)\)
这里假设\(X \in \mathbb{R}^{n \times n}\)。
其中\(|\cdot|\)表行列式,\(X^*\)表\(X\)的伴随矩阵,当\(X\)可逆的时候\(X^{-1}|X| = X^*\)
我们用\(x_{ij}\)来表示\(X_{ij}\)的代数余子式,对于任意\(X_{ij}\)而言:
而且其中仅有第\(i\)项与\(X_{ij}\)有关,
所以
而
容易证得\(\mathrm{Tr}(X^*\mathrm{d}X) =\sum \limits_{i,j=1}^n x_{ij} \mathrm{d}X_{ij}\)得证。
杂
\((A+B)^{-1} = A^{-1}(A^{-1}+B^{-1})^{-1}B^{-1}\)
其中\(A, B\)均可逆.
证:
证毕.
\((A+UCV)^{-1}=A^{-1}-A^{-1}U(C^{-1}+VA^{-1}U)^{-1}VA^{-1}\)
设\(A \in \mathbb{R}^{n \times n}\)为非奇异矩阵, \(U \in \mathbb{R}^{n \times m}, V \in \mathbb{R}^{m \times n}\), 令\(C \in \mathbb{R}^{m \times m }\)为非奇异矩阵, 则\(A+UCV\)可逆当且仅当\(C^{-1}+VA^{-1}U\)可逆, 并且
证明:
\(\Leftarrow\)
记\(X:=A+UCV\), \(Y=A^{-1}-A^{-1}U(C^{-1}+VA^{-1}U)^{-1}VA^{-1}.\)
\(\Rightarrow\)
若\(C^{-1}+VA^{-1}U\)不可逆, 则存在特征向量\(x\):
则
特例
\(C=1, U=u \in \mathbb{R}^n, V^T=v \in \mathbb{R}^d\), 则