导数、偏导数、梯度

求导公式:

  • C=0(C)C' = 0 \quad (C为常数)

  • (xn)=nxn1{(x^n)}' = n x^{n-1}

  • (ex)=ex{(e^x)}' = e^x

  • (ax)=ln(a)ax{(a^x)}' = \ln(a)a^x

  • (ln(x))=1x{(\ln(x))}' = \dfrac 1 x

  • (loga(x))=1ln(a)x{(\log_a(x))}' = \dfrac 1 {\ln(a)x}

  • (sinx)=cosx{(\sin x)}' = \cos x

  • (cosx)=sinx{(\cos x)}' = -\sin x

  • (tanx)=1cos2x{(\tan x)}' =\dfrac 1 {\cos ^2 x}

  • (cotx)=1sin2x{(\cot x)}' =-\dfrac 1 {\sin ^2 x}

求导法则:

  • (Cf(x))=Cf(x){(Cf(x))}' = C f'(x)
  • (af(x)+bg(x))=af(x)+bg(x){(af(x) + bg(x))}' = a f'(x) + bg'(x)
  • (f(x)g(x))=f(x)g(x)+f(x)g(x){(f(x)g(x))}' = f'(x)g(x) + f(x) g'(x)
  • (f(x)g(x)h(x))=f(x)g(x)h(x)+f(x)g(x)h(x)+f(x)g(x)h(x){(f(x)g(x)h(x))}' = f'(x)g(x)h(x) + f(x) g'(x)h(x) + f(x)g(x)h'(x)
  • (f(x)g(x))=f(x)g(x)f(x)g(x)(g(x))2{\left (\dfrac {f(x)} {g(x)} \right )}' = \dfrac {f'(x)g(x) - f(x) g'(x)} {(g(x))^2}

链式法则:

牛顿记法: (f[g(x)])=f[g(x)]g(x){(f[g(x)])}' = f'[g(x)] g'(x)
或用莱布尼茨记法:df[g(x)]dx=df[g(x)]d[g(x)]dg(x)dx\dfrac {\rm {d f[g(x)]} } {\rm {dx}} = \dfrac {\rm {d f[g(x)]} } {\rm {d [g(x)]}} \dfrac {\rm {dg(x)} } {\rm {dx}}
牛顿记法中,f(t)f'(t)表示的是关于tt的导数,而(f)(f)'表示的是关于xx的导数。莱布尼茨记法中分号下面dfdt\dfrac {\rm {df}} {\rm {dt}}表示的就是关于tt的导数


偏导数:

如果是多变量函数,如f(x,y)=by2+axy+cx+df(x,y)=by^2+axy+cx+d(几何上对应三维空间下的一个曲面),我们可以取x=x0x=x_0(几何上对应三维空间下的一个平面)代入,就会得到一个单变量函数:fx0(y)=by2+ax0y+cx0+df_{x_0}( y)=by^2+ax_0y+cx_0+d(几何上对应位于x=x0x=x_0平面上的一条曲线,实际就是曲面和平面的相交线)。对这个新函数fx0f_{x_0},我们可以求其关于y的导函数:(fx0(y))=2by+ax0(f_{x_0}(y))' = 2by + ax_0,此时的导数相当于曲面ffx0x_0处的yy方向上的变化率。

ff对于任意xx值,都有一个单变量函数相对应(想象用所有垂直与x轴的平面与曲面相交)。这些单变量函数关于yy的导函数的形式,都跟ffx=x0x=x_0处的曲线fx0f_{x_0},关于yy的导函数的形式一样(只不过把式中的x0x_0值换为其他值):(fx(y))=2by+ax(f_{x}(y))' = 2by + ax。我们称其为ff关于yy的偏导数:f(x,y)y\dfrac {\partial {f(x,y)}} {\partial y}。反映了曲面在yy方向上的变化率。

推广到更多变量的函数,用一个超平面去和其相交,也能得到一个单变量函数。这个单变量函数的导数就是其在此单变量方向上的变化率。所以要求函数关于一个变量的偏导数,只需要将其他变量看作常数,如f(x,y)=by2+axy+cx+df(x,y)=by^2+axy+cx+dff关于yy的偏导数就是把xx当作常量看待对其求导: f(x,y)y=2by+ax\dfrac {\partial {f(x,y)}} {\partial y} = 2by + ax

梯度:

一个函数,如:f(x,y)f(x, y),其在点(x,y)(x,y)上的关于xxyy的偏导数组成的向量[fx,fy]\left [\dfrac {\partial f} {\partial x}, \dfrac {\partial f} {\partial y} \right ],就是ff在点(x,y)(x,y)的梯度。
梯度是一个向量值函数,向量值函数的值域为一个线性空间或线性空间的子集,是一个标量点到向量的映射,记作:f\nabla f

标量值函数ff在点aa的梯度记为f(a)\nabla f(a)

梯度的含义:假设f(x,y)f(x, y)是三维空间中一个曲面,则ff在点aa的梯度是一个二维向量。点aa沿梯度方向增加(自变量)值,函数值增长是最快的。而且梯度大小(向量长度)代表自变量增加一个单位向量,函数值的最大变化量。

向量场是把空间中的每一点指派到一个向量的映射,所以梯度就是一个向量场。

线性空间:线性空间里的元素有两种运算(加法和数乘),而且经过这两种运算(就是线性变换)得到的元素还在同一个线性空间中(所谓对这两种运算封闭)。
线性空间也叫向量空间。

凸函数:

一个函数是凸的当且仅当其上境图(在函数图像上方的点集)为一个凸集
凸集就是集合内任意两点的连线上的点也都属于此集合。
(在国内数学教程,凸函数的概念有时被叫做凹函数)

posted @ 2018-12-19 11:04  xuejianbest  阅读(1593)  评论(0编辑  收藏  举报