深感文字之乏力与思绪之混乱
原计划标题为《深感数学改革之必要性》,但是写完之后决定改成现在的标题。
看不懂不用说,是我太拉了。
I.前言
前些日子微积分课上学习了微分。当时糊里糊涂就糊弄过去了,听着也挺对的,后面的求导、中值定理之流也没有任何影响:主要是因为,在绝大部分时候,我们在意的都是 导数 而非 微分。导数就像一个被精美包装过的黑匣子:无论是复合、乘法还是除法,抑或是高阶导数、泰勒展开,都可以以 Lagrange 的符号系统,简简单单地用几个 \('\) 解决问题。
但是,当我们逐渐深入微积分后,我们将会发现,导数是不可靠的:积分、偏导、多元微积分……越来越多的知识跳脱出了那方精巧的黑匣子,不再囿于 Lagrange 的 \('\) 的束缚。我们必须跳出导数的概念,去探索那狂野的、纯真的微分,寻找那原始的美。
II.楔子
不知道大家有没有见过一个式子,所谓的“小学生也能懂的微积分”:
乍一看,这确实是极其明了的了:上下约分自然成立。
但是,首先,这并不是约分;其次,这似乎与我们一开始的“微分”的定义有些许的差别。
III.引入
一个一元函数 \(f(x)\) 是线性函数,如果它满足 \(f(\lambda x+\mu y)=\lambda f(x)+\mu f(y)\) 对于全体 \(x,y,\lambda,\mu\in\R\) 均成立。
一个线性函数总是可以写成如下的形式:\(f(x)=\lambda x\),其中 \(\lambda\) 被称作其 比例系数。
一个点是定义域的内点,当且仅当其存在一个邻域,使得邻域中所有元素都有定义。
对于 \(f(x)\) 的一个内点 \(x_0\),定义一个线性函数 \(L(h)\) 是其 微分,若满足 \(f(x_0+h)=f(x_0)+L(h)+o(h),h\to0\) 成立。
此时,我们定义 \(\d f(x_0)(h):=L(h)\)。同时定义其 导数 \(f'(x_0)\) 为 \(L(h)\) 的比例系数。也即,\(f'(x_0)=\dfrac{L(h)}h\)。
我们首先要牢记一点:即,\(\d f(x_0)(h)\) 永远是一个 法则,它根据输入的 \(x_0,h\) 来唯一输出一个值。这个法则是相当完备的:它仅依靠 \(f,x_0,h\) 三者就能唯一确定输出。而 \(f\) 是什么?\(f\) 是另一个 法则,它接受一个输入以唯一给出一个输出。可以发现,这里我们说的法则,其实就是常规而言的 函数。为什么我避免使用函数呢?因为函数和变量之间的混用情况太多了,正如 \(y=kx+b\) 其实是指 \(y=y(x)\),其中 \(y(x)\) 是一个函数(法则),其针对输入 \(x\) 给出了唯一的输出 \(kx+b\)。为了避免这种积重难返的混用,我在此处用 法则 来代指一个函数。显然,一个变量不会是一个法则,而法则也不会是一个变量:二者的区分是很清晰的。
那我们回过头来,看看导数吧:\(f'(x_0)\),它是一个完备的、在 \(f,x_0\) 确定后就能够唯一确定输出的法则吗?
好像,反常识地,这似乎是成立的;那么,我们常见的所谓的“对 \(x\) 求导”“对 \(t\) 求导”是什么意思呢?
这是因为,\(f(x)\) 中的 \(x\) 不一定是变量;如果 \(x\) 其实指的是一个函数 \(x(t)\),那么 \(f(x(t))\) 就是以 \(t\) 为输入的一个法则。同理,套娃还可以继续下去,\(t\) 可以事实上是 \(t(y)\),\(y\) 可以事实上是 \(y(r)\)……
打住。我们就在 \(r\) 这里停止,现在我们就认为我们的函数是 \(f(x(t(y(r))))\) 这个东西。其等效于另一个法则 \(g(r)\),其与前面的一大坨有着相同的定义域和输出。此时,\(g(r)\) 可以定义其对应的导数,导数接受 \(r_0\) 作为输入,给出其在 \(r_0\) 处的导数。
我们将这种行为,定义为“\(f\) 关于 \(r\) 求导”。同理,还可以定义展开到 \(y,t,x\) 的“\(f\) 关于 \(y,t,x\) 求导”。
\(f\) 关于 \(r\) 求导,在 \(r_0\) 处的导数,按照 Leibniz 的记号可以记作 \(\left.\dfrac{\d f}{\d r}\right|_{r_0}\)。
需要注意的是,虽然 Leibniz 记号有着所谓“分数”的形式,但它并不是分数,应该把其视作一个整体,其整体表示在 \(r_0\) 处的导数。
而,\(\dfrac{\d f}{\d r}\) 则是一个函数,即为 \(f\) 关于 \(r\) 求导得到的函数。这是因为,一个函数 \(f\) 在 \(x_0\) 处的导数可以写作 \(\lim\limits_{\Delta x\to0}\dfrac{f(x_0+\Delta x)-f(x_9)}{(x_0+\Delta x)-x_0}=\lim\limits_{\Delta x\to0}\dfrac{\Delta f}{\Delta x}\),其中将左侧的分子记作 \(\Delta f\),然后对于 \(\dfrac{\Delta f}{\Delta x}\)“上下同趋于 \(0\)”这个过程记作 \(\dfrac{\d f}{\d x}\)。
此时我们回到 Lagrange 记号。在 Lagrange 记号下,导函数记作 \(f'_r\),在 \(r_0\) 处的取值为 \(f'_r(r_0)\)。如果 \(r\) 本身就是 \(f\) 的自变量,也即如果是 \(f(r)\) 对 \(r\) 求导或是 \(f(x)\) 对 \(x\) 求导这种场合,下标的 \(r/x\) 可以扔掉,直接写 \(f'\) 表示导函数,\(f'(x_0)\) 表示其在 \(x_0\) 处的取值。
既然导数有着“关于某某变量求导”的说法,那么微分有没有呢?事实上,我们接下来将会看到,在一元微积分中,不论关于哪个变量微分,其都有相同的形式,即所谓的“微分的形式不变性”。
总结:微分记作 \(\d f(x_0)(h)\)(在 \(x_0,h\) 均确定后,其是一个常数)。如果是 \(\d f(x_0)\),最后一维被扔掉了,那么指的是一个函数,也即 \(f\) 在 \(x_0\) 处微分的整个函数。\(\left.\dfrac{\d f}{\d r}\right|_{r_0}\) 是常数,\(\dfrac{\d f}{\d r}\) 是函数。
IV.恼人的省略
回到我们一开始给出的式子
这个式子已经简略到了依照我们一开始的定义来看,完全无法理解的程度了。
它其实是一个这样的形式:首先 \(y\) 可以被看作是 \(y(x)\),也即 \(y\) 是一个以 \(x\) 为自变量的函数;\(x\) 自身也是 \(x(x)\),一个以 \(x\) 为自变量的函数。那么,上式的实际意义是:
- 对于 \(y(x)\) 定义域中的一切 \(x_0\),都有 \(\d y(x_0)\) 这个 函数 是 \(\dfrac{\d y}{\d x}(x_0)\d x(x_0)\) 这个函数(前半部分是在 \(x_0\) 处的导数,一个常数;后半部分是一个函数)。
- 再展开一层,就是在 \(x_0\) 确定时,对于一切 \(h\),都有 \(\d y(x_0)(h)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)(h)\)。
这个式子是易证的:因为易验证 \(\d x(x_0)(h)=h\),按照定义 \(\dfrac{\d y}{\d x}(x_0)=\dfrac{\d y(x_0)(h)}{h}\),于是上式自然成立。
为什么我们可以将 \(\d y(x_0)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)\) 简写成 \(\d y=\dfrac{\d y}{\d x}\d x\) 呢?这就是 早期数学家做事不严谨 的锅了。
事实上,这个式子的偏 Lagrange 形式的描述 \(\d y(x_0)=f'(x_0)\d x(x_0)\) 确实是较为严谨的。然后数学家就整出了 \(\d y(x)=f'(x)\d x\) 这样的花活:这个式子和前一个式子描述了同一个东西,只不过用 \(x\) 重命名了 \(x_0\),且最后一个 \(\d x\) 使用了这样的约定:
- 如果 \(y=f(x)\),那么 \(\d f(x)\) 可以被写成 \(\d y\)。
- 因此,\(x=x\),那么 \(\d x(x)\) 可以被写成 \(\d x\)。
- \(\d x(x)\) 这个描述,前一个 \(x\) 描述了微分对象是恒同映射 \(\tau (x)=x\),后一个 \(x\) 表明在 \(x\) 处求微分,它们没有联系。
V.更多的省略
链索法则:
如果 \(y=f(z),z=g(y)\),那么
上式对于一切 \(x_0\) 成立,且 \(z_0=g(x_0)\)。
这其实根据我们前面的分析简单处理就能得到。
然后就是万恶的省略了。Leibniz 大手一挥,上式被简化成了这样:
同时,因为 \(\d y=\dfrac{\d y}{\d z}\d z\),\(\d z=\dfrac{\d z}{\d x}{\d x}\),因此由链索法则我们得到了 \(\d y=\dfrac{\d y}{\d x}\d x\)。
于是,\(\d y=\dfrac{\d y}{\d z}\d z=\dfrac{\d y}{\d x}\d x\),这被称作“一阶微分的形式不变性”。
我们把它尝试展开,就是如下的形式:
- 对于一切 \(x_0\) 和 \(z_0=g(x_0)\) 和一切 \(h\),都有\[\d y(z_0)(h)=\dfrac{\d y}{\d z}(z_0)\d z(z_0)(h)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)(h) \]这个式子其实是表明,无论“关于何值作微分”(也即式子 \(\dfrac{\d y}{\d t}\d t\),\(t\) 是任意值),它们都相等,都等于所谓的 \(\d y\)。于是,微分就没有“关于某值微分”的概念:你关于任何值求导,由导数推出的微分都是相同的。
VI.不要给我自顾自地就开始省略啊喂!
如果 \(y=y(x)\),且存在反函数 \(x=x(y)\),那么在右式两边同时对 \(x\) 求导,得到 \(1=\dfrac{\d y}{\d x}\dfrac{\d x}{\d y}\),所以 \(\dfrac{\d x}{\d y}=\dfrac1{\left(\dfrac{\d y}{\d x}\right)}\)。写成 Lagrange 的形式的话,就是若 \(y=f(x)\),那么 \((f^{-1})'(y_0)=\dfrac1{f'(x_0)}\),其中 \(y_0=f(x_0)\) 或者 \(x_0=f^{-1}(y_0)\)。
看着好像很对是吧?你要不要看看这个式子 \(1=\dfrac{\d y}{\d x}\dfrac{\d x}{\d y}\) 是坨什么东西?
事实上,左侧的 \(1\) 不是一个常数:它是一个函数。\(x\) 对 \(x\) 求导,得到的东西是常函数 \(1\)。
而右侧,其实是 \(x(y)\) 对 \(x\) 求导,使用链式法则的结果。
因此扩写应该是,\(1=\dfrac{\d y}{\d x}(x_0)\dfrac{\d x}{\d y}(y_0)\),所以可以有上述的 Lagrange 形式。
这又是什么?
这也是导数。我们把 \(\dfrac\d{\d x}\) 看作是一个算子,这个算子作用于一个函数可以得到另一个函数(其导函数)。
于是二阶导
可以被写成
到目前为止,还好吧?
那么这个呢?
有点头晕了吧?这其实就是上面那个东西的省略。下面的 \(\d x^2\),约定俗成地,如果在这种场合指的是 \((\d x)^2\) 而非 \(\d(x^2)\) 或者其它什么东西。
参数方程。
假定 \(y=y(t),x=x(t)\),
且存在反函数 \(t=t(x)\),
则 \(y=y(t(x))\)。
还是得把式子拆开来。
第二项到第三项是用了之前证的反函数定理。
对于每一组匹配的 \((y_0,x_0,t_0)\),有此式成立。
VII.通用的破译方法
对于一个复杂的、包含多个微分和导数的式子,你可以通过如下的方式来将一大坨已经省略得不成人样的式子破译:
首先,你的式子中涉及了若干个变量。取一组值 \((x_0,y_0,z_0,\dots)\)。因为我们是一元微积分,所以这一组值中须有一个核心的自变量,使得其确定后其它变量的值也随即确定。
然后,对于你式子中的微分,将其后面补上第一个括号,为其自变量对应的 \(x_0\)(或者 \(y_0,z_0\) 抑或是其它东西)。然后补上第二个括号 \((h)\)。
对于你式子中的导数 \(\dfrac{\d m}{\d n}\),后面补上括号 \((n_0)\)。
这样,我们便得到一个破译完成的式子:其是一个值等于另一个值的形式。
VIII.尾声
感觉自己写了一坨答辩。
评价为:眼高手低,把很简单的东西整的过于复杂。
有必要纠正想到哪写到哪、遇事不决先开写的坏习惯了。