矩阵求导

向量变元的实值标量函数

    $f(\boldsymbol{x}), \boldsymbol{x}=\left[x_{1}, x_{2}, \cdots, x_{n}\right]^{T}$

  梯度向量形式

    $\nabla_{x} f(\boldsymbol{x})=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}=\left[\frac{\partial f}{\partial x_{1}}, \frac{\partial f}{\partial x_{2}}, \cdots, \frac{\partial f}{\partial x_{n}}\right]^{T}$


 

四个法则

常数求导

  与一元函数常数求导相同:结果为零向量

    $\frac{\partial c}{\partial \boldsymbol{x}}=\mathbf{0}_{n \times 1}$

  其中, $c$ 为常数。

线性法则

  与一元函数求导线性法则相同:相加再求导等于求导再相加,常数提外面

    $\frac{\partial\left[c_{1} f(\boldsymbol{x})+c_{2} g(\boldsymbol{x})\right]}{\partial \boldsymbol{x}}=c_{1} \frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}}+c_{2} \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}$

  其中,$c_{1}, c_{2}$ 为常数。

乘积法则

  与一元函数求导乘积法则相同:前导后不导 加 前不导后导

     $\frac{\partial[f(\boldsymbol{x}) g(\boldsymbol{x})]}{\partial \boldsymbol{x}}=\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} g(\boldsymbol{x})+f(\boldsymbol{x}) \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}$

商法则

  与一元函数求导商法则相同:(上导下不导 减 上不导下导)除以(下的平方):

    $\frac{\partial\left[\frac{f(\boldsymbol{x})}{g(\boldsymbol{x})}\right]}{\partial \boldsymbol{x}}=\frac{1}{g^{2}(\boldsymbol{x})}\left[\frac{\partial f(\boldsymbol{x})}{\partial \boldsymbol{x}} g(\boldsymbol{x})-f(\boldsymbol{x}) \frac{\partial g(\boldsymbol{x})}{\partial \boldsymbol{x}}\right]$

  $\text { 其中, } g(\boldsymbol{x}) \neq 0 \text { 。 }$


 

几个公式

公式 1 

    $\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{a}\right)}{\partial \boldsymbol{x}}=\frac{\partial\left(\boldsymbol{a}^{T} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{a}$

  其中, $\boldsymbol{a} $ 为常数向量, $\boldsymbol{a}=\left(a_{1}, a_{2}, \cdots, a_{n}\right)^{T}$  。

公式 2 

    $\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=2 \boldsymbol{x}$

公式 3 

    $\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{A} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{A} x+\boldsymbol{A}^{T} \boldsymbol{x}$

  其中,$\boldsymbol{A}_{n \times n}$  是常数矩阵,$\boldsymbol{A}_{n \times n}=\left(a_{i j}\right)_{i=1, j=1}^{n, n}$

公式 4 

    $\frac{\partial\left(\boldsymbol{a}^{T} \boldsymbol{x} \boldsymbol{x}^{T} \boldsymbol{b}\right)}{\partial \boldsymbol{x}}=\boldsymbol{a} \boldsymbol{b}^{T} \boldsymbol{x}+\boldsymbol{b} \boldsymbol{a}^{T} \boldsymbol{x}$

  其中,$  \boldsymbol{a}, \boldsymbol{b}$  为常数向量,$  \boldsymbol{a}=\left(a_{1}, a_{2}, \cdots, a_{n}\right)^{T}, \boldsymbol{b}=\left(b_{1}, b_{2}, \cdots, b_{n}\right)^{T}$

 

posted @ 2021-10-28 10:37  图神经网络  阅读(538)  评论(0编辑  收藏  举报
Live2D