《陶哲轩实分析》定理10.1.15:导数的链法则

设$X,Y$是$\mathbf{R}$的子集合,$x_0\in X$是$X$的极限点,并设$y_0\in Y$是$Y$的极限点.设$f:X\to Y$是函数,使得$f(x_0)=y_0$并且$f$在$x_0$处可微.假设$g:Y\to\mathbf{R}$是在$y_0$处可微的函数,那么函数$g\circ f:X\to\mathbf{R}$在$x_0$处可微,且
  \begin{equation}
    \label{eq:15.14.40}
    (g\circ f)'(x_0)=g'(y_0)f'(x_0)
  \end{equation}

证明:
  \begin{equation}
    \label{eq:15.14.41}
    g(f(x_0))'=\lim_{\Delta x\to 0;\Delta x\neq 0}\frac{g(f(x_0+\Delta x))-g(f(x_0))}{\Delta x}
  \end{equation}
令$f(x_0+\Delta x)=f(x_0)+\varepsilon(\Delta x)$.其中$\Delta x\to 0$时,$\varepsilon(\Delta x)\to 0$.则\ref{eq:15.14.41}变成
  \begin{equation}
    \label{eq:15.14.54}
    \lim_{\Delta x\to 0;\Delta x\neq 0}\frac{g(f(x_0)+\varepsilon(\Delta x))-g(f(x_0))}{\Delta x}
  \end{equation}

\ref{eq:15.14.54}可以变成
  \begin{equation}
    \label{eq:15.14.57}
    \lim_{\Delta x\to 0;\Delta x\neq 0}\frac{g(f(x_0)+\varepsilon(\Delta x))-g(f(x_0))}{\varepsilon(\Delta x)}\frac{\varepsilon (\Delta x)}{\Delta x}
  \end{equation}
但是\ref{eq:15.14.57}要成立,首先得保证$\varepsilon(\Delta x)$不为0(否则分母没意义).

当$f'(x_0)\neq 0$时,我们取足够小的$|\Delta x|>0$后,总可以使$\varepsilon(\Delta x)$保持非负(根据这里)(为什么?).因此在$f'(x_0)\neq 0$时,我们不必担心当$\Delta x\to 0$时,$\varepsilon(\Delta x)$可能会等于零这个问题.

当$f'(x_0)=0$时,在$\Delta x\to 0$的过程中,$\varepsilon(\Delta x)$可能会等于零.这时,\ref{eq:15.14.57}不再成立.虽然\ref{eq:15.14.57}不再成立,但是\ref{eq:15.14.54}仍成立.当$\varepsilon(\Delta x)=0$时,
  \begin{equation}
    \label{eq:15.18.32}
    \lim_{\Delta x\to 0;\Delta x\neq 0;\varepsilon(\Delta x)=0}\frac{f(f(x_0)+\varepsilon(\Delta x))-g(f(x_0))}{\Delta x}=0
  \end{equation}
而且$g'(x_0)f'(x_0)=0$.而且
  \begin{equation}
    \lim_{\Delta x\to 0;\Delta x\neq 0;\varepsilon(\Delta x)\neq 0}\frac{g(f(x_0)+\varepsilon(\Delta x))-g(f(x_0))}{\varepsilon(\Delta x)}\frac{\varepsilon(\Delta x)}{\Delta x}=0
  \end{equation}
综上,链法则得证.

 

 

注1:另一种证明方法如下:我先给出函数 $g\circ f$ 在 $y_0$ 处可微,且导数为 $L$ 的充要条件:(Newton 逼近)$f(x)-(f(x_0)+L(x-x_0)=o(|x-x_0|)$.其中 $\lim_{x\to x_0;x\neq x_0}\frac{o(|x-x_0|)}{x-x_0}=0$.


下面我们来证明
\begin{align*}
  (g\circ f)(x)-(g\circ f(x_0)+g'(y_0)f'(x_0)(x-x_0)=o(|x-x_0|).
\end{align*}
由于 $f$ 在点 $x_0$ 处可微,因此
\begin{align*}
  f'(x_0)(x-x_0)=f(x_0)-f(x)+o_1(|x-x_0|).
\end{align*}
于是我们只用证明
\begin{align*}
  (g\circ f)(x)-(g\circ f(x_0)+g'(y_0)(f(x_0)-f(x)+o_1(|x-x_0|))=o(|x-x_0|).
\end{align*}
由于 $g$ 在 $y_0$ 处可微,因此易得
\begin{align*}
  g'(y_0)(f(x_0)-f(x)+o_1(|x-x_0|))=g\circ f(x_{0})-g\circ f(x)+o_2(|x-x_0|).
\end{align*}
(为什么?)于是我们只用证明
\begin{align*}
  2(g\circ f)(x)-2(g\circ f)(x_{0})=o_2(|x-x_0|)+o(|x-x_0|)=o_3(|x-x_0|).
\end{align*}
命题得证(为何?).

 

注2:利用以上这个另一种方法可以证明多元微积分中的复合函数求导法则.

posted @ 2012-10-15 18:47  叶卢庆  阅读(157)  评论(0编辑  收藏  举报