求导公式:
-
C′=0(C为常数)
-
(xn)′=nxn−1
-
(ex)′=ex
-
(ax)′=ln(a)ax
-
(ln(x))′=x1
-
(loga(x))′=ln(a)x1
-
(sinx)′=cosx
-
(cosx)′=−sinx
-
(tanx)′=cos2x1
-
(cotx)′=−sin2x1
求导法则:
- (Cf(x))′=Cf′(x)
- (af(x)+bg(x))′=af′(x)+bg′(x)
- (f(x)g(x))′=f′(x)g(x)+f(x)g′(x)
- (f(x)g(x)h(x))′=f′(x)g(x)h(x)+f(x)g′(x)h(x)+f(x)g(x)h′(x)
- (g(x)f(x))′=(g(x))2f′(x)g(x)−f(x)g′(x)
链式法则:
牛顿记法: (f[g(x)])′=f′[g(x)]g′(x)
或用莱布尼茨记法:dxdf[g(x)]=d[g(x)]df[g(x)]dxdg(x)
牛顿记法中,f′(t)表示的是关于t的导数,而(f)′表示的是关于x的导数。莱布尼茨记法中分号下面dtdf表示的就是关于t的导数
偏导数:
如果是多变量函数,如f(x,y)=by2+axy+cx+d(几何上对应三维空间下的一个曲面),我们可以取x=x0(几何上对应三维空间下的一个平面)代入,就会得到一个单变量函数:fx0(y)=by2+ax0y+cx0+d(几何上对应位于x=x0平面上的一条曲线,实际就是曲面和平面的相交线)。对这个新函数fx0,我们可以求其关于y的导函数:(fx0(y))′=2by+ax0,此时的导数相当于曲面f在x0处的y方向上的变化率。
f对于任意x值,都有一个单变量函数相对应(想象用所有垂直与x轴的平面与曲面相交)。这些单变量函数关于y的导函数的形式,都跟f在x=x0处的曲线fx0,关于y的导函数的形式一样(只不过把式中的x0值换为其他值):(fx(y))′=2by+ax。我们称其为f关于y的偏导数:∂y∂f(x,y)。反映了曲面在y方向上的变化率。
推广到更多变量的函数,用一个超平面去和其相交,也能得到一个单变量函数。这个单变量函数的导数就是其在此单变量方向上的变化率。所以要求函数关于一个变量的偏导数,只需要将其他变量看作常数,如f(x,y)=by2+axy+cx+d求f关于y的偏导数就是把x当作常量看待对其求导: ∂y∂f(x,y)=2by+ax
梯度:
一个函数,如:f(x,y),其在点(x,y)上的关于x和y的偏导数组成的向量[∂x∂f,∂y∂f],就是f在点(x,y)的梯度。
梯度是一个向量值函数,向量值函数的值域为一个线性空间或线性空间的子集,是一个标量点到向量的映射,记作:∇f。
标量值函数f在点a的梯度记为∇f(a)。
梯度的含义:假设f(x,y)是三维空间中一个曲面,则f在点a的梯度是一个二维向量。点a沿梯度方向增加(自变量)值,函数值增长是最快的。而且梯度大小(向量长度)代表自变量增加一个单位向量,函数值的最大变化量。
向量场是把空间中的每一点指派到一个向量的映射,所以梯度就是一个向量场。
线性空间:线性空间里的元素有两种运算(加法和数乘),而且经过这两种运算(就是线性变换)得到的元素还在同一个线性空间中(所谓对这两种运算封闭)。
线性空间也叫向量空间。
凸函数:
一个函数是凸的当且仅当其上境图(在函数图像上方的点集)为一个凸集
凸集就是集合内任意两点的连线上的点也都属于此集合。
(在国内数学教程,凸函数的概念有时被叫做凹函数)