矩阵求导
向量变元的实值标量函数
$f(\boldsymbol{x}), \boldsymbol{x}=\left[x_{1}, x_{2}, \cdots, x_{n}\right]^{T}$
梯度向量形式
$\nabla_{x} f(\boldsymbol{x})=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}=\left[\frac{\partial f}{\partial x_{1}}, \frac{\partial f}{\partial x_{2}}, \cdots, \frac{\partial f}{\partial x_{n}}\right]^{T}$
四个法则
常数求导
与一元函数常数求导相同:结果为零向量
$\frac{\partial c}{\partial \boldsymbol{x}}=\mathbf{0}_{n \times 1}$
其中, $c$ 为常数。
线性法则
与一元函数求导线性法则相同:相加再求导等于求导再相加,常数提外面
$\frac{\partial\left[c_{1} f(\boldsymbol{x})+c_{2} g(\boldsymbol{x})\right]}{\partial \boldsymbol{x}}=c_{1} \frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}+c_{2} \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}$
其中,$c_{1}, c_{2}$ 为常数。
乘积法则
与一元函数求导乘积法则相同:前导后不导 加 前不导后导
$\frac{\partial[f(\boldsymbol{x}) g(\boldsymbol{x})]}{\partial \boldsymbol{x}}=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} g(\boldsymbol{x})+f(\boldsymbol{x}) \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}$
商法则
与一元函数求导商法则相同:(上导下不导 减 上不导下导)除以(下的平方):
$\frac{\partial\left[\frac{f(\boldsymbol{x})}{g(\boldsymbol{x})}\right]}{\partial \boldsymbol{x}}=\frac{1}{g^{2}(\boldsymbol{x})}\left[\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} g(\boldsymbol{x})-f(\boldsymbol{x}) \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}\right]$
$\text { 其中, } g(\boldsymbol{x}) \neq 0 \text { 。 }$
几个公式
公式 1
$\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{a}\right)}{\partial \boldsymbol{x}}=\frac{\partial\left(\boldsymbol{a}^{T} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{a}$
其中, $\boldsymbol{a} $ 为常数向量, $\boldsymbol{a}=\left(a_{1}, a_{2}, \cdots, a_{n}\right)^{T}$ 。
公式 2
$\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=2 \boldsymbol{x}$
公式 3
$\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{A} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{A} x+\boldsymbol{A}^{T} \boldsymbol{x}$
其中,$\boldsymbol{A}_{n \times n}$ 是常数矩阵,$\boldsymbol{A}_{n \times n}=\left(a_{i j}\right)_{i=1, j=1}^{n, n}$
公式 4
$\frac{\partial\left(\boldsymbol{a}^{T} \boldsymbol{x} \boldsymbol{x}^{T} \boldsymbol{b}\right)}{\partial \boldsymbol{x}}=\boldsymbol{a} \boldsymbol{b}^{T} \boldsymbol{x}+\boldsymbol{b} \boldsymbol{a}^{T} \boldsymbol{x}$
其中,$ \boldsymbol{a}, \boldsymbol{b}$ 为常数向量,$ \boldsymbol{a}=\left(a_{1}, a_{2}, \cdots, a_{n}\right)^{T}, \boldsymbol{b}=\left(b_{1}, b_{2}, \cdots, b_{n}\right)^{T}$
因上求缘,果上努力~~~~ 作者:图神经网络,转载请注明原文链接:https://www.cnblogs.com/BlairGrowing/p/15474427.html