微积分小感——1.导数与微分

微积分小感——1.导数与微分

所需的前置知识:
1)函数的概念
2)实数理论
3)极限理论(第0章

§1.导数

—1.速度、切线与导数的定义

​ 想当年,牛老爵爷[1]发明“导数”(他称之为“流数”)的概念,便是为了解决如下的问题:

已知函数 \(y=f(x)\) 描述了物体路程 \(y\) 与时间点 \(x\) 的关系,
求函数 \(y'=f'(x)\) 描述物体的瞬时速度 \(y'\) 与时间点 \(x\) 的关系,
这函数被称为函数 \(y=f(x)\) 的导数。
(规定路程的正方向,速度带有符号——正向运动为正,反向运动为负)

​ 回想物理中速度的定义式 \(v=s/t\) ,这里的 \(s\)\(t\) 都是“路程段”、“时间段”,而时间点 \(x\) 上的“时间段”长度为 \(0\) (点的定义就是没有长度——或看作长度为 \(0\) ——的线段),经过的“路程段”长度也为零,那么这一点的速度不就是 \(0/0\) 了吗?!这该如何是好?

​ 我们不妨秉持着“用有限逼近无穷”的理念(这里的“无穷”是指无穷小),给这一时间点”延伸“出一段有限的时间长度 \(\Delta x\)\(\Delta x > 0\) ,这是一整个记号),那么相应的,路程也会延伸出一段 \(\Delta y=f(x+\Delta x)-f(x)\) ,定义这一点上的速度为:

\[y'=f'(x)=\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} =\lim_{\Delta x \to 0}{\frac{f(x+\Delta x)-f(x)}{\Delta x}} \]

这便得到导数的定义式。

​ 从几何中”切线“的角度看,我们对”切线“这一概念的希望是”与曲线 \(y=f(x)\) 仅有一点 \((x_0,y_0)\) 接触的一条直线“,但是两点才能确定一条直线(欧几里得的直线公理),这又该如何是好?我们依旧秉持“用有限逼近无穷”的理念,在函数上另取一点 \((x_0+\Delta x,y_0+\Delta y)\) (若这一点有切线,则取点的左右不会产生实际的影响,现在先不妨 \(\Delta x > 0\)\(<0\) 的情况读者可自行推演),作两点间的割线:

\[L_{sec}(\Delta x):\frac{y-y_0}{\Delta y}=\frac{x-x_0}{\Delta x} \Rightarrow y=\frac{\Delta y}{\Delta x}(x-x_0)+y_0 \]

定义切线为 \(\Delta x \to 0\) 时的割线,便得到切线的方程如下:

\[L_{tan} = \lim_{\Delta x \to 0}{L_{sec}(\Delta x)} : y=\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} \cdot (x-x_0)+y_0 \Rightarrow y = f'(x_0) \cdot (x-x_0) + y_0 \]

\(L_{tan}:y = f'(x_0) \cdot (x-x_0) + y_0\) ,函数在这一点的导数(也就是一个点沿着曲线运动到这一点时的瞬时速度)恰好是这一点上的切线的斜率!这就解释了物理上的关于运动的定律:质点在某一点的运动方向,沿曲线在这一点的切线方向。

​ 总结一下:

对于函数 \(y=f(x)\) ,定义其导数为:

\[y'=f'(x)=\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} =\lim_{\Delta x \to 0}{\frac{f(x+\Delta x)-f(x)}{\Delta x}} \]

(一点 \(x=x_0\) 上导数存在的条件是以上极限在这一点有意义)

附注
有时会出现要对多个不同的变元求导的情况,我们把这一次求导的变元记为导数符号的下标,如 \(y=f(x)\) 的导数记作 \(y'_x\)\(x=g(t)\) 的导数记作 \(x'_t\) ,嵌套函数 \(y=f(g(t))\) 的导数记作 \(y'_t\)

—2.导数的运算法则

​ 既定义了导数,自然要研究其运算法则:

对于函数 \(u=f(x)\)\(v=g(x)\)

\((ⅰ)\quad\) 加减法则: \((u \pm v)'=u' \pm v'\)
\((ⅱ)\quad\) 系数法则: \((k \cdot u)'=k \cdot u'\)\(k\) 为常数)
\((ⅲ)\quad\) 乘法法则: \((uv)'=u'v+v'u\)
\((ⅳ)\quad\) 除法法则: \((\frac{u}{v})'=\frac{u'v-v'u}{v^2}\) (此时 \(v \neq 0\)
\((ⅴ)\quad\) 嵌套法则: \(u'_x=u'_v v'_x\) (或以括号的形式表做 \((f(g(x)))'=f'(g(x))g'(x)\)

前两条运算法则容易用极限的运算法则(极限的加减法则和系数法则)检验,后三条则没有那么显然。下面我们运用导数的定义式和极限的各种运算法则,轮流加以证明:

  1. 乘法法则: \((uv)'=u'v+v'u\)

    \(y=uv\) ,给自变量 \(x\) 一个增量 \(\Delta x\) ,则 \(u\)\(v\) 分别获得增量 \(\Delta u\)\(\Delta v\) (这样的论证形式会在下面两个定理的证明中反复出现)。那么 \(y\) 获得增量:

    \[\Delta y = (y+\Delta y)-y=(u+\Delta u)(v+\Delta v)-uv=u\Delta v+v\Delta u+\Delta u\Delta v \]

    \(u\)\(v\) 的导数有限,则当 \(\Delta x \to 0\) 时,有 \(\Delta u \to 0\)\(\Delta v \to 0\) ,故 \(\Delta y \to 0\)

    根据导数的定义式:

    \[\begin{align*} (uv)'=y' & =\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} \\ & =\lim_{\Delta x \to 0}{\frac{u\Delta v+v\Delta u+\Delta u\Delta v}{\Delta x}} \\ & =u\lim_{\Delta x \to 0}{\frac{\Delta v}{\Delta x}}+v\lim_{\Delta x \to 0}{\frac{\Delta u}{\Delta x}}+\lim_{\Delta x \to 0}{\frac{\Delta u\Delta v}{\Delta x}} \\ & =uv'+vu'+\lim_{\Delta x \to 0}{\frac{\Delta u\Delta v}{\Delta x}} \end{align*} \]

    上式末尾的一项便趋于 \(0\) (可将其视作一个有限的导数乘以一个无穷小的增量),即 \((uv)'=u'v+uv'\) 。该法则便得到证明。

  2. 除法法则: \((\frac{u}{v})'=\frac{u'v-v'u}{v^2}\) (此时 \(v \neq 0\)

    \(y=\frac{u}{v}\) ,给自变量 \(x\) 一个增量 \(\Delta x\) ,则 \(u\)\(v\) 分别获得增量 \(\Delta u\)\(\Delta v\) 。那么 \(y\) 获得增量:

    \[\Delta y=(y+\Delta y)-y=\frac{u+\Delta u}{v+\Delta v}-\frac{u}{v} =\frac{v\Delta u-u\Delta v}{v(v+\Delta v)} \]

    \(u\)\(v\) 的导数有限,则当 \(\Delta x \to 0\) 时,有 \(\Delta u \to 0\)\(\Delta v \to 0\) ,故 \(\Delta y \to 0\)

    根据导数的定义式:

    \[\begin{align*} (\frac{u}{v})'=y' & = \lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} \\ & = \lim_{\Delta x \to 0}{\frac{\frac{1}{\Delta x}(v\Delta u-u\Delta v)}{v(v+\Delta v)}} \\ & = \lim_{\Delta x \to 0}{\frac{v\frac{\Delta u}{\Delta x}-u\frac{\Delta v}{\Delta x}}{v(v+\Delta v)}} \\ & = \frac{u'v-v'u}{v^2} \end{align*} \]

    该法则便得到证明。

  3. 嵌套法则: \(u'_x=u'_v v'_x\)

    给自变量 \(x\) 一个增量 \(\Delta x\) ,则 \(v\) 获得增量 \(\Delta v\)\(u\) 于是获得增量 \(\Delta u\) ,根据导数的定义式:

    \[u'_x=\lim_{\Delta x \to 0}{\frac{\Delta u}{\Delta x}} =\lim_{\Delta x \to 0}{(\frac{\Delta u}{\Delta v}\cdot\frac{\Delta v}{\Delta x})} =\lim_{\Delta x \to 0}{\frac{\Delta u}{\Delta v}}\cdot\lim_{\Delta x \to 0}{\frac{\Delta v}{\Delta x}} \]

    \(u\)\(v\) 的导数有限时,若 \(\Delta x \to 0\) ,则 \(\Delta v \to 0\) ,则:

    \[u'_x=\lim_{\Delta v \to 0}{\frac{\Delta u}{\Delta v}}\cdot\lim_{\Delta x \to 0}{\frac{\Delta v}{\Delta x}}=u'_v v'_x \]

    该法则便得到证明。

    万事具备,拿上新工具,开始对我们熟悉的那些函数下刀!

—3.一些常见函数的导数

  1. 有理函数

    我们先考虑最单纯的有理函数:

    求导 \(y=x^n \ (n \in \mathbb{N})\)

    根据导数的定义式:

    \[y'=\lim_{\Delta x \to 0}{\frac{(x+\Delta x)^n-x^n}{\Delta x}} \]

    由二项式定理:

    \[(x+\Delta x)^n=\sum^{n}_{k=0}{\binom{n}{k}(\Delta x)^k x^{n-k}} =x^n + \Delta x \cdot nx^{n-1} + (\Delta x)^2 \cdot \sum^{n}_{k=2}{\binom{n}{k}(\Delta x)^{k-2} x^{n-k}} \]

    记最后一项为 \((\Delta x)^2 \cdot S\)\(S\) 有限),代入导数的定义式:

    \[y'=\lim_{\Delta x \to 0}{\frac{x^n+\Delta x \cdot nx^{n-1}+(\Delta x)^2 \cdot S-x^n}{\Delta x}} =nx^{n-1} + \lim_{\Delta x \to 0}{\Delta x \cdot S}=nx^{n-1} \]

    \((x^n)'=nx^{n-1}\)

    使用除法法则可以将 \(n\) 扩展到 \(n \in \mathbb{Z}\) ,读者可以自行验证 \(n \in \mathbb{Z}\) 时上述公式的正确性。使用加减法则和系数法则可以解决有理整函数,辅以除法法则可以解决有理分式函数(这会带来十分可观的计算量,从技术上来看,对高次式在有理范围因式分解后使用乘法法则会使计算中的各部分有可提的公因式,一定程度上减少计算量)。

  2. 三角函数

    三角函数的求导与上一章中三角函数的极限密切相关。尤其是当 \(x \to 0\) 时,有 \(\sin x \sim x\)\(\cos x \sim 1\) (还记得 \(\sim\) 这个符号吧),这将会提供极大的帮助。

    求导 \(y=\sin x\)

    根据导数的定义式:

    \[y'=\lim_{\Delta x \to 0}{\frac{\sin(x+\Delta x)-\sin x}{\Delta x}} \]

    使用 \(\sin\) 的和角公式展开:

    \[y'=\lim_{\Delta x \to 0}{\frac{\sin x \cos\Delta x+\sin\Delta x \cos x-\sin x}{\Delta x}} \]

    \(\Delta x \to 0\) 时,有 \(\sin\Delta x \sim \Delta x\)\(\cos\Delta x \sim 1\) ,于是:

    \[y'=\lim_{\Delta x \to 0}{\frac{\sin x +\Delta x \cos x-\sin x}{\Delta x}}=\lim_{\Delta x \to 0}{\cos x}=\cos x \]

    \(\sin'x=\cos x\)

    求导 \(y=\cos x\)

    根据导数的定义式:

    \[y'=\lim_{\Delta x \to 0}{\frac{\cos(x+\Delta x)-\cos x}{\Delta x}} \]

    使用 \(\cos\) 的和角公式展开:

    \[y'=\lim_{\Delta x \to 0}{\frac{\cos x \cos\Delta x-\sin x \sin\Delta x -\cos x}{\Delta x}} \]

    \(\Delta x \to 0\) 时,有 \(\sin\Delta x \sim \Delta x\)\(\cos\Delta x \sim 1\) ,于是:

    \[y'=\lim_{\Delta x \to 0}{\frac{\cos x -\sin x \Delta x-\cos x}{\Delta x}}=\lim_{\Delta x \to 0}{-\sin x}=-\sin x \]

    \(\cos'x=-\sin x\)

    求导 \(y=\tan x\)

    注意到 \(\tan x=\cfrac{\sin x}{\cos x}\) ,根据除法法则:

    \[y'=\frac{\sin'x\cos x-\cos'x\sin x}{\cos^2 x} =\frac{\sin^2x+\cos^2x}{\cos^2x}=\frac{1}{\cos^2x}=\sec^2x \]

    \(\tan'x=\sec^2x\)

    另一半三角函数的导数可以用三角函数之间的倒数关系导出。

  3. 指数函数

    虽不明就里,我们且先从 \(e\) 的指数函数开始,其原因会在推导过程中逐渐显现。

    求导 \(y=e^x\)

    根据导数的定义式:

    \[y'=\lim_{\Delta x \to 0}{\frac{e^{x+\Delta x}-e^x}{\Delta x}} \]

    稍加变形,我们可以将含 \(x\) 的部分分离出极限:

    \[y'=\lim_{\Delta x \to 0}{\frac{e^x e^{\Delta x}-e^x}{\Delta x}} =\lim_{\Delta x \to 0}{e^x\cdot\frac{e^{\Delta x}-1}{\Delta x}} =e^x\cdot\lim_{\Delta x \to 0}{\frac{e^{\Delta x}-1}{\Delta x}} \]

    还记得 \(e\) 的性质吗?根据 \(\lim_{x \to 0}{( 1 + x )^{\frac{1}{x}}}=e\) ,做如下变形:

    \[\lim_{x \to 0}{( 1 + x )^{\frac{1}{x}}}=e \\ \lim_{x \to 0}{\frac{( 1 + x )^{\frac{1}{x}}}{e}}=1 \\ \lim_{x \to 0}{\frac{1 + x}{e^x}}=1 \]

    即当 \(x \to 0\) 时,\(e^x \sim x+1\) 。那么当 \(\Delta x \to 0\) 时,\(e^{\Delta x} \sim \Delta x+1\) ,带入原式:

    \[y'=e^x\cdot\lim_{\Delta x \to 0}{\frac{e^{\Delta x}-1}{\Delta x}} =e^x\cdot\lim_{\Delta x \to 0}{\frac{\Delta x+1-1}{\Delta x}} =e^x \]

    \((e^x)'=e^x\)

    这是个极美妙的结论。当我们用定义式求以其他数为底的指数函数的导数时,我们会对分离后得到的那个极限束手无策,而 \(e\) 的性质是解决那个极限的——可以说唯一的——办法。

    一般的指数函数 \(a^x\) 的导数可以用嵌套法则导出(下面记 \(e^x\)\(\exp(x)\) ):

    \[(a^x)'=(\exp(x\ln a))'=(x\ln a)'\cdot \exp'(x\ln a)=\ln a \cdot \exp(x\ln a)=\ln a\cdot a^x \]

  4. 对数函数和幂函数

    有了指数函数,我们可以通过一种“方程”的形式,从函数之间的恒等式出发,两侧同时求导,导出对数函数和指数函数的导数。这里主要会用到嵌套法则。

    求导 \(y=\ln x\)

    由对数的定义得到如下的恒等式:

    \[e^y=e^{\ln x}=x \]

    两边求导(左侧运用嵌套法则),得到:

    \[y' \cdot e^y=1 \]

    除掉 \(y'\) 的“系数”,得到:

    \[y'=\frac{1}{e^y}=\frac{1}{x} \]

    \((\ln x)'=\frac{1}{x}\)

    一般对数函数的导数可以用对数的换底公式简单求出:

    \[(\log_ax)'=\left(\frac{\ln x}{\ln a}\right)'=\frac{1}{x\ln a} \]

    求导 \(y=x^n \ (n\in\mathbb{R})\)

    注意到恒等式:

    \[y=x^n=e^{n\ln x} \]

    两边求导(右侧运用嵌套法则),得到:

    \[y'=(n\ln x)'\cdot e^{n\ln x}=\frac{n}{x}\cdot x^n=nx^{n-1} \]

    \((x^n)'=nx^{n-1}\) ,有理函数中的结论依然成立。

​ 以上便是初等函数的求导。我们常见的函数基本上都是以上函数的堆砌。读者便可拿着这五条法则和五类基本函数的导数,“拿着锤子把什么都当作钉子”,将所见的所有函数统统作为练习材料,提升求导技术(这类计算机可做的活儿都可算作“体力活”)的同时,或许还能发现导数与函数之间的奇妙联系(这将会在第2章涉及)。

§2.微分

—1.无穷小的分阶

​ 在介绍微分之前,先要引入“无穷小的分阶”这一前置知识:

对于 \(x\to a\) 时关于 \(x\) 的两无穷小量 \(u\)\(v\)

  1. \(\lim_{x\to a}{\frac{u}{v}}=0\) ,则称 \(u\) 是比 \(v\) 高阶的无穷小,记作 \(u=\omicron(v)\)
  2. \(\lim_{x\to a}{\frac{u}{v}}=k \quad(k\in\mathbb{R}_{\neq 0})\) ,则称 \(u\)\(v\) 是同阶无穷小。

可以看出,无穷小的分阶取决于两个无穷小的比值是否为无穷小(比值为无穷大时,颠倒分子分母即可;若此极限不存在,则这两个无穷小不可比较)。

​ 值得注意的是高阶无穷小符号 \(\omicron(v)\) 的意义。这个符号其实代表了一个(关于同一自变量 \(x\) 的)函数集合 \(F\),里面的元素 \(u\in F\) 满足 \(\lim_{x\to a}{\frac{u}{v}}=0\)\(u=\omicron(v)\) 就相当于 \(u\in F\) 。如此,像:

\[\omicron(v)\pm\omicron(v)=\omicron(v)\\ \omicron(v)\times\omicron(v)=\omicron(v) \]

这样看似奇怪的运算法则便是顺理成章的。

​ 对于同阶无穷小,有一重要定理:

对于 \(x\to a\) 时关于 \(x\) 的两无穷小量 \(u\)\(v\)\(\lim_{x \to a}{\frac{u}{v}}=k\) 当且仅当 \(u=kv+\omicron(v)\)

  • 由前推后:

    将极限中的常数移到极限内:

    \[\lim_{x \to a}{(\frac{u}{v}-k)}=0 \]

    稍加变形:

    \[\lim_{x \to a}{\frac{u-kv}{v}}=0 \]

    根据高阶无穷小的定义,得到:

    \[u-kv=\omicron(v) \]

    即结论中的式子。

  • 由后推前:

    直接将 \(u\)\(v\) 的关系式带入:

    \[\lim_{x\to a}{\frac{u}{v}}=\lim_{x\to a}{\frac{kv+\omicron(v)}{v}} =\lim_{x\to a}{(k+\frac{\omicron(v)}{v})} =k+\lim_{x\to a}{\frac{\omicron(v)}{v}}=k \]

    即结论中的式子。

这定理说明了在极限计算和近似公式中,可以将复杂的无穷小替换为相对简单的等价无穷小,而极限的结果不变,近似公式的误差(即 \(\omicron(v)\) )也在可接受的范围内。

—2.微分的定义

​ 终于回到正题,注意到导数的定义式:

\[y'=\lim_{\Delta x \to 0}{\frac{\Delta y}{\Delta x}} \]

若此处的导数有限且非零,那么此时 \(\Delta y\)\(\Delta x\) 是同阶无穷小,且:

\[\Delta y=y'\cdot \Delta x+\omicron(\Delta x) \]

我们记 \(\text{d}y=y'\cdot\Delta x\)\(\text{d}x=\Delta x\) (这只是为了保持记号的一致性),那么上式就可改写成:

\[\Delta y=\text{d}y+\omicron(\text{d}x) \]

其中 \(\text{d}y\) 称为 \(y\) 的微分。从中我们可以看出,微分是对函数增量的近似,就如下图(粉红色为点 \(P\) 处的切线,点 \(\text{dY}\) 表示点 \((x_0+\Delta,y_0+\text{d}y)\) ,点 \(\Delta\text{Y}\) 表示点 \((x_0+\Delta,y_0+\Delta y)\) ,蓝色的线段表示 \(\Delta y\)\(\text{d}y\) 的差,动态演示见文件§2-2.ggb):

​ 我们同时得到了导数的另一表示方法:

\[y'=\frac{\text{d}y}{\text{d}x} \]

这记号的右边有时被看作一个整体,这就是导数的莱布尼茨记号[2]

​ 将导数公式中的导数用微分替换,就得到以下的微分公式:

对于函数 \(u=f(x)\)\(v=g(x)\)

\((ⅰ)\quad\) 加减法则: \(\text{d}(u \pm v)=\text{d}u \pm \text{d}v\)
\((ⅱ)\quad\) 系数法则: \(\text{d}(k \cdot u)=k \cdot \text{d}u\)\(k\) 为常数)
\((ⅲ)\quad\) 乘法法则: \(\text{d}(uv)=v\text{d}u+u\text{d}v\)
\((ⅳ)\quad\) 除法法则: \(\text{d}(\frac{u}{v})=\frac{v\text{d}u-u\text{d}v}{v^2}\) (此时 \(v \neq 0\)
\((ⅴ)\quad\) 嵌套法则: \(\text{d}u=\frac{\text{d}u}{\text{d}v}\text{d}v=\frac{\text{d}u}{\text{d}v}\frac{\text{d}v}{\text{d}x}\text{d}x\)

—3.用微分求导

​ 由公式 \(y'_x=\frac{\text{d}y}{\text{d}x}\) ,我们可以把导数转换成微分的比,这能大大简化一些函数的求导。

​ 比如参数方程形式的函数:

已知 \(y=\phi(t)\)\(x=\psi(t)\) 及其导数,求 \(y=f(x)\) 的导数

\[y'_x=\frac{\text{d}y}{\text{d}x} =\frac{\frac{\text{d}y}{\text{d}t}}{\frac{\text{d}x}{\text{d}t}}=\frac{y'_t}{x'_t} \]

带回函数的形式,即:

\[f'(x)=\frac{\phi'(t)}{\psi'(t)} \]

​ 以及反函数的导数:

已知函数 \(y=f(x)\) 及其导数,求反函数 \(x=f^{-1}(y)\) 的导数

\[x'_y=\frac{\text{d}x}{\text{d}y}=\frac{1}{\frac{\text{d}y}{\text{d}x}}=\frac{1}{y'_x} \]

带回函数的形式,即:

\[(f^{-1}(y))'=\frac{1}{f'(x)} \]

​ 有了这两把利器,我们就可以求导一些形式更为奇葩的函数:

  1. 反三角函数

    求导 \(y=\arcsin x\)

    套用反函数求导法:

    \[y'=\frac{1}{x'_y}=\frac{1}{\sin'y}=\frac{1}{\cos y} \]

    这个函数是含 \(y\) 的,我们带入 \(y\) ,并用反三角函数的定义加以化简:

    \[y'=\frac{1}{\cos y}=\frac{1}{\cos(\arcsin x)} =\frac{1}{\sqrt{1-\sin^2(\arcsin x)}}=\frac{1}{\sqrt{1-x^2}} \]

    \(\arcsin'x =\frac{1}{\sqrt{1-x^2}}\)

    求导 \(y=\arccos x\)

    同上:

    \[y'=\frac{1}{x'_y}=\frac{1}{\cos'y}=\frac{1}{-\sin y} =-\frac{1}{\sin(\arccos x)} =-\frac{1}{\sqrt{1-\cos^2(\arccos x)}}=-\frac{1}{\sqrt{1-x^2}} \]

    \(\arccos'x =-\frac{1}{\sqrt{1-x^2}}\)

    求导 \(y=\arctan x\)

    同上:

    \[y'=\frac{1}{x'_y}=\frac{1}{\tan'y}=\frac{1}{\sec^2 y} =\frac{1}{\sec^2(\arctan x)} =\frac{1}{1+\tan^2(\arctan x)}=\frac{1}{1+x^2} \]

    \(\arctan'x =-\frac{1}{1+x^2}\)

  2. 圆方程

    面对 \(x^2+y^2=r^2 \quad(r\in\mathbb{R}^+)\) 这样 \(x\)\(y\) 并非函数关系的曲线方程,它的导数该怎么求呢?

    首先,可以把此方程改写为参数方程的形式,即用一个参变量 \(t\)\(x\)\(y\) 都表示为它的函数:

    \[x^2+y^2=r^2 \Longleftrightarrow \left\{ \begin{align*} x=r\sin t\\ y=r\cos t\\ \end{align*} \right. \]

    然后使用参数方程的求导方法:

    \[y'_x=\frac{y'_t}{x'_t}=\frac{(r\sin t)'}{(r\cos t)'} =\frac{r\cos t}{-r\sin t}=-\cot t \]

    或者将 \(x\)\(y\) 重新带入,得到 \(y'_x=-\frac{x}{y}\)

    或者,我们可以使用之前用到的等式两边同时求导的思想(下面使用莱布尼茨记号):

    \[\begin{align*} x^2+y^2&=r^2 &&\Rightarrow\text{原方程} \\ \frac{\text{d}}{\text{d}x}(x^2+y^2)&=\frac{\text{d}}{\text{d}x}r^2 &&\Rightarrow\text{两边求导} \\ \frac{\text{d}}{\text{d}x}x^2+\frac{\text{d}}{\text{d}x}y^2&=0 &&\Rightarrow\text{右边常数的导数为零} \\ 2x+2y\frac{\text{d}y}{\text{d}x}&=0 &&\Rightarrow\text{左边第二项使用嵌套法则} \\ \frac{\text{d}y}{\text{d}x}&=-\frac{x}{y} &&\Rightarrow\text{移项,除掉系数} \\ \end{align*} \]

    得到与上一种方法同样的结果。这种方法被称为“隐函数求导”。

    附注
    注意到对于圆上一点 \(P(x,y)\) ,直线 \(OP\) 的斜率 \(\frac{y}{x}\) 与此点的切线斜率(即导数) \(-\frac{x}{y}\) 互为负倒数,这就是几何上的结论:圆上一点处的切线垂直于过这一点的直径。

  3. 双曲线方程

    求导 \(y^2=x^2-r^2\)

    定义双曲三角函数:

    \[\sinh x=\frac{e^x-e^{-x}}{2} \\ \cosh x=\frac{e^x+e^{-x}}{2} \]

    容易验证如下的式子:

    \[\sinh^2 x=\cosh^2 x-1 ,\\ \sinh'x=\cosh x \ ,\ \cosh'x=\sinh x \]

    取参数 \(t\) 使 \(y=r\sinh t\)\(x=r\cosh t\) ,使用参数方程的求导方法:

    \[\frac{\text{d}y}{\text{d}x} =\frac{\frac{\text{d}y}{\text{d}t}}{\frac{\text{d}x}{\text{d}t}} =\frac{(r\sinh t)'}{(r\cosh t)'} =\frac{r\cosh t}{r\sinh t}=\frac{x}{y} \]

    附注
    双曲三角函数(后面会不时见到)与三角函数十分相似,如三角函数关于 \(e\) 的恒等式 \(\sin x=\frac{1}{2}(e^{ix}-e^{-ix})\)\(\cos x=\frac{1}{2}(e^{ix}+e^{-ix})\) 就与双曲三角函数的定义式十分相似。

​ 实际上,微分的引入就是为了把整个的导数 \(y'\) 拆分成两个微分 \(\text{d}y\)\(\text{d}x\) 之比,这样在进行变形时可以更灵活的移动。微分的真正妙用要到微分积分方程(大概第5章?)的时候才会充分体现。

§3.高阶导数和高阶微分

—1.高阶导数

​ 注意到,关于 \(x\) 的函数 \(y\) 求导之后,得到的导数 \(y'\) 依旧是关于 \(x\) 的函数,我们可以对 \(y'\) 再求导,得到函数的二阶导数,记作 \(y''\) 。一般的,定义函数 \(y\)\(n+1\) 阶导数[3]为:

\[y^{(n+1)}=(y^{(n)})'\qquad(n\in\mathbb{N}^*) \]

​ 同样,高阶导数也有其运算法则:

对于函数 \(u=f(x)\)\(v=g(x)\)\(n\in\mathbb{N}^*\)

\((ⅰ)\quad\) 加减法则: \((u \pm v)^{(n)}=u^{(n)}\pm v^{(n)}\)
\((ⅱ)\quad\) 系数法则: \((k \cdot u)^{(n)}=k \cdot u^{(n)}\)\(k\) 为常数)
\((ⅲ)\quad\) 乘法法则: \((uv)^{(n)}=\sum_{k=0}^{n}{C^k_n u^{(n-k)}v^{(k)}}\) (又称莱布尼茨公式)

我们使用归纳法加以证明:

  • \(n=1\) 时,根据导数的运算法则,结论成立。

  • 当以上法则对于 \(n<m\) 均成立时,对于 \(n=m\) ,有:

    \[(u \pm v)^{(m)} =\left((u \pm v)^{(m-1)}\right)' =\left(u^{(m-1)}\pm v^{(m-1)}\right)' =\left(u^{(m-1)}\right)'\pm \left(v^{(m-1)}\right)'=u^{(m)}\pm v^{(m)} \\ (k \cdot u)^{(m)} =\left((k \cdot u)^{(m-1)} \right)' =\left(k \cdot u^{(m-1)} \right)'=k \cdot u^{(m)} \qquad\qquad\qquad\qquad\qquad\qquad\qquad\quad\ \\ \begin{align*} (uv)^{(m)} & =\left((uv)^{(m-1)}\right)'\\ & =\left(\sum_{k=0}^{m-1}{C^k_{m-1} u^{(m-1-k)}v^{(k)}}\right)' \\ & =\sum_{k=0}^{m-1}{C^k_{m-1} \left(u^{(m-k)}v^{(k)}+u^{(m-1-k)}v^{(k+1)}\right)} \\ & =\sum_{k=0}^{m-1}{C^k_{m-1} u^{(m-k)}v^{(k)}}+\sum_{k=1}^{m}{C^{k-1}_{m-1} u^{(m-k)}v^{(k)}} \\ & =C^0_{m-1}u^{(m)}v^{(0)}+\sum_{k=1}^{m-1}{\left(C^k_{m-1}+C^{k-1}_{m-1}\right)u^{(m-k)}v^{(k)}}+C^{m-1}_{m-1}u^{(0)}v^{(m)} \\ & =\sum_{k=0}^{m}{C^k_{m} u^{(m-k)}v^{(k)}} \end{align*}\qquad\qquad\quad \]

以上法则便得到证明。

可以看到,前两条法则是对导数运算法则的自然继承,第三条则于二项式定理极其相似——只不过把幂的次数换成的导数的阶数。而与导数的除法法则、嵌套法则对应的高阶导数运算法则由于太过复杂,故不加描述(实在有耐性的读者可自行推演,但似乎并没有涉及这些公式的参考资料)。

—2.高阶微分

​ 根据我们定义微分时的经验,对于 \(y\)\(n\) 阶微分 \(\text{d}^n y\) ,我们似乎会定义如下的高阶微分:

\[\text{d}^n y = y^{(n)}\text{d}x \]

但是正确的定义是这样的[4]

\[\text{d}^n y=y^{(n)}\text{d}x^n \]

为什么呢?

​ 我们重新审视一下微分 \(\text{d} y=y'\text{d}x\) ,发现 \(\text{d} y\) 可以看作一个二元函数 \(\text{d} y=f(x,\text{d}x)\) ,其中的两变量 \(x\)\(\text{d} x\) 相互独立(不要因为 \(\text{d}x\) 里带了一个 \(x\) 就认为二者有关系, \(\text{d} x\) 是根据一个任意增量 \(\Delta x\) 定义的无穷小量),当我们对 \(\text{d} y\) 做(多次的、对变量 \(x\) 的)微分操作时,就应把 \(\text{d}x\) 视作常数。所以:

\[\text{d}^2 y=\text{d}\left(\text{d}y\right) =\text{d}\left(y'\text{d}x\right) =\text{d}(y')\cdot\text{d}x =y''\text{d}x\cdot\text{d}x =y''\text{d}x^2 \]

利用归纳法,就可以得到高阶微分的定义 \(\text{d}^n y=y^{(n)}\text{d}x^n\)

​ 同样,我们可以得到导数的微分表示法:

\[y^{(n)}=\frac{\text{d}^n y}{\text{d}x^n} \]

​ 高阶导数和高阶微分的运用会在下一章“用导数研究函数”谈到。

§4.导数与微分的应用

—1.物体冷却

对于一个初始温度为 \(T_0\) 的物体,在环境温度恒为 \(T_c\) 的时候,降温的速度与物体当前温度与外界的温度差成正比,求物体温度关于时间的函数 \(T(t)\)

​ 注意到降温速度就是温度的变化速度,也就是温度的导数,得出以下关系式:

\[T'(t)=-k(T(t)-T_c)=-k\cdot T(t)+k T_c \]

其中正数 \(k\) 为比例系数(由于降温,故带负号)。什么函数的导数与原函数形式基本类似(只相差一个系数和一个常数)?当然是 \(e^x\) 。我们调配一下系数:

\[\begin{align*} & y=e^x & \Rightarrow &&& y'=e^x \\ & y=e^{-kx} & \Rightarrow &&& y'=-ke^{-kx} \\ & y=e^{-kx}+T_c &\Rightarrow &&&y'=-ke^{-kx} \end{align*} \]

就得到了答案 \(T(t)=e^{-kt}+T_c\)

​ 等等,我们似乎还没做完。注意到物体的初始温度为 \(T_0\) ,也就是 \(T(0)=T_0\) ,这个条件该如何满足?注意到如果在 \(e\) 的指数上配一个常数数 \(\lambda\) ,不仅不会影响如上函数与导数的关系,而且由 \(T(0)=T_0\) 可以解出常数 \(\lambda\) 的值:

\[\begin{align*} e^{-k\cdot0+\lambda}+T_c &= T_0 \\ e^{\lambda}+T_c &= T_0 \\ \lambda &= \ln(T_0-T_c) \end{align*} \]

所以最终的答案是 \(T(t)=e^{-kt+\ln(T_0-T_c)}+T_c\)

​ 如上凑系数的过程多有运气成分,对于这类“已知函数与其导数的关系求函数”的问题,会在微分积分方程那一章详细分析。这里只是让大家体会导数对函数变化速度的描述。

—2.一个关于对数的不等式

\(m>n>1\) ,则对于任意 \(x>1\) ,满足:

\[(m-1)\log_m x > (n-1)\log_n x \]

​ 做不等式两边的比,则原不等式成立当且仅当:

\[1<\frac{(m-1)\log_m x}{(n-1)\log_n x} =\frac{m-1}{n-1}\cdot\frac{\frac{\ln x}{\ln m}}{\frac{\ln x}{\ln n}} =\frac{m-1}{n-1}\cdot\frac{\ln n}{\ln m} \]

即求证当 \(m>n>1\) 时,满足:

\[\frac{m-1}{\ln m}>\frac{n-1}{\ln n} \]

即求证当 \(x>1\) 时,函数 \(y=\frac{x-1}{\ln x}\) 为增函数。

​ 如果一个函数在一个区间上为增函数,那么其函数值就是不断增加的,也就是说它的变化速度 \(y'\) 在这个区间上恒正。我们求导这个函数,得到:

\[y'=\left(\frac{x-1}{\ln x}\right)' =\frac{(x-1)'\ln x-(x-1)(\ln x)'}{\ln^2 x} =\frac{\ln x-1+\frac{1}{x}}{\ln^2 x} \]

其分母恒正,那么原不等式成立当且仅当当 \(x>1\) 时, \(u=\ln x +\frac{1}{x}>1\)

​ 当 \(x=1\) 时, \(u=\ln x +\frac{1}{x}=1\) ;那么只须证当 \(x>1\) 时, \(u'>0\) 即可,因为这样函数值从 \(1\) 开始不断增加,就满足关于 \(y'\) 的不等式。于是:

\[u'=\left(\ln x+\frac{1}{x}\right)'=\frac{1}{x}-\frac{1}{x^2} \]

显然当 \(x>1\) 时, \(u'>0\) 。那么原不等式成立。

—3.求三次方程近似解

计算方程 \(x^3-2x^2-4x-7=0\) 的近似解,精确到 \(0.001\)

​ 我们首先估计根的范围。令函数 \(f(x)=x^3-2x^2-4x-7\) ,那么 \(f(3)=-10<0\)\(f(4)=9>0\) ,那么函数的零点就应该在开区间 \((3,4)\) 上。

​ 那么怎么继续精确我们的估计呢?注意到函数一点的切线描述了函数在这一点附近的变化情况,那么用一点的切线代替这一点的函数,就能简化计算而得到较为精确的估计了。于是求出该函数在点 \(x=x_0\) 的切线方程为:

\[L_{tan} : y = f'(x_0) \cdot (x-x_0) + f(x_0) \]

其零点值为:

\[x_{root}=x_0-\frac{f(x_0)}{f'(x_0)}=x_0-\frac{x_0^3-2x_0^2-4x_0-7}{3x_0^2-4x_0-4} \]

回到本题,我们从 \(x=4\) 开始,使用这个式子不断迭代(如前面的图):

\[\begin{align*} & x_0=4 \\ & x_1=x_0-\frac{x_0^3-2x_0^2-4x_0-7}{3x_0^2-4x_0-4}\approx3.6786 \\ & x_2=x_1-\frac{x_1^3-2x_1^2-4x_1-7}{3x_1^2-4x_1-4}\approx3.6329 \\ & x_3=x_2-\frac{x_2^3-2x_2^2-4x_2-7}{3x_2^2-4x_2-4}\approx3.6320 \\ & x_4=x_3-\frac{x_3^3-2x_3^2-4x_3-7}{3x_3^2-4x_3-4}\approx3.6320 \\ \end{align*} \]

我们发现 \(x_3\approx x_4\) ,精度达到,故原方程的解 \(x_{root}\approx 3.632\)

​ 用切线代替原函数不断迭代求得零点的方法,被称为“牛顿法”。

—4.简谐振动

一弹簧每一时刻的震动位移可用函数 \(x=A\sin \omega t\) 描述,求弹簧震动的瞬时速度 \(v\) 和瞬时加速度 \(a\)

​ 速度是位移对时间的导数:

\[v=\frac{\text{d}x}{\text{d}t}=A\omega \cos \omega t \]

故位移为 \(0\) 时,速度最大;位移最大时,速度为零。

​ 加速度是速度对时间的导数,位移对时间的二阶导数:

\[a=\frac{\text{d}v}{\text{d}t}=\frac{\text{d}^2x}{\text{d}t^2} =-A\omega^2\sin \omega t=-\omega x \]

即加速度大小与位移成正比,方向与位移相反。根据牛顿第二定律 \(F=ma\) ,得出弹力 \(F=-m\omega x\) ,也就是胡克定律 \(F=-kx\)


​ 微分的世界已在我们眼前展开。描述函数的变化速度,并通过这对函数加以分析研究,便是微分学的任务。用一点的切线描述原曲线在该点附近的变化,便是微分的核心。下一章,我们将基于微分学三大中值定理,将导数与原函数的性质紧密联系起来,使导数与微分真正称为研究函数局部性质的利器。

\[\ \\ \ \\ \ \\ \ \\ \mathtt{Square-Circle} : 2021.3.24 \sim 2021.7.14 \ \\ \]



  1. 牛顿莱布尼茨关于微积分发明权的论战至今未止,目前通行的说法是两人从不同角度相互独立地发展出微积分。本章选择从牛顿的角度(即运动学的角度)对导数与微分加以阐释,导数的记号使用牛顿的记号(这是由于一开始(即在引入严谨的微分定义以前)容易把莱布尼茨的记号看作分数,造成不必要的混乱)。 ↩︎

  2. 据作者本人所知,苏联的教材惯用牛顿记号 \(y'\) ,而美国教材惯用莱布尼茨记号\(\frac{\text{d}y}{\text{d}x}\) ,有一些数学软件中,用在函数名上加撇号 \('\) 或用记号 \(\frac{\text{d}}{\text{d}x}\) 后接函数的方法表示求导。 ↩︎

  3. 当导数的阶数足够低(如三阶及以下),我们可以在函数名上加撇号 \('\) 表示。当阶数较高或含有字母时,一般用括号 \(()\) 包裹阶数表示。有时为了普遍性,认定零阶导数为函数本身,即 \(y^{(0)}=y\)↩︎

  4. 我们把微分的幂次 \((\text{d}x)^n\) 记作 \(\text{d}x^n\) ,而幂函数 \(x^n\) 的微分记作 \(\text{d}(x^n)\) ,两者有本质的不同。 ↩︎

posted @ 2021-07-14 19:39  Square_Circle  阅读(691)  评论(0编辑  收藏  举报