深感文字之乏力与思绪之混乱

\[\newcommand{\d}{\mathrm d} \]

原计划标题为《深感数学改革之必要性》，但是写完之后决定改成现在的标题。

看不懂不用说，是我太拉了。

I.前言

前些日子微积分课上学习了微分。当时糊里糊涂就糊弄过去了，听着也挺对的，后面的求导、中值定理之流也没有任何影响：主要是因为，在绝大部分时候，我们在意的都是导数而非微分。导数就像一个被精美包装过的黑匣子：无论是复合、乘法还是除法，抑或是高阶导数、泰勒展开，都可以以 Lagrange 的符号系统，简简单单地用几个 \('\) 解决问题。

但是，当我们逐渐深入微积分后，我们将会发现，导数是不可靠的：积分、偏导、多元微积分……越来越多的知识跳脱出了那方精巧的黑匣子，不再囿于 Lagrange 的 \('\) 的束缚。我们必须跳出导数的概念，去探索那狂野的、纯真的微分，寻找那原始的美。

II.楔子

不知道大家有没有见过一个式子，所谓的“小学生也能懂的微积分”：

\[\d y=\dfrac{\d y}{\d x}\d x \]

乍一看，这确实是极其明了的了：上下约分自然成立。

但是，首先，这并不是约分；其次，这似乎与我们一开始的“微分”的定义有些许的差别。

III.引入

一个一元函数 \(f(x)\) 是线性函数，如果它满足 \(f(\lambda x+\mu y)=\lambda f(x)+\mu f(y)\) 对于全体 \(x,y,\lambda,\mu\in\R\) 均成立。

一个线性函数总是可以写成如下的形式：\(f(x)=\lambda x\)，其中 \(\lambda\) 被称作其 比例系数。

一个点是定义域的内点，当且仅当其存在一个邻域，使得邻域中所有元素都有定义。

对于 \(f(x)\) 的一个内点 \(x_0\)，定义一个线性函数 \(L(h)\) 是其微分，若满足 \(f(x_0+h)=f(x_0)+L(h)+o(h),h\to0\) 成立。

此时，我们定义 \(\d f(x_0)(h):=L(h)\)。同时定义其导数 \(f'(x_0)\) 为 \(L(h)\) 的比例系数。也即，\(f'(x_0)=\dfrac{L(h)}h\)。

我们首先要牢记一点：即，\(\d f(x_0)(h)\) 永远是一个法则，它根据输入的 \(x_0,h\) 来唯一输出一个值。这个法则是相当完备的：它仅依靠 \(f,x_0,h\) 三者就能唯一确定输出。而 \(f\) 是什么？\(f\) 是另一个法则，它接受一个输入以唯一给出一个输出。可以发现，这里我们说的法则，其实就是常规而言的函数。为什么我避免使用函数呢？因为函数和变量之间的混用情况太多了，正如 \(y=kx+b\) 其实是指 \(y=y(x)\)，其中 \(y(x)\) 是一个函数（法则），其针对输入 \(x\) 给出了唯一的输出 \(kx+b\)。为了避免这种积重难返的混用，我在此处用法则来代指一个函数。显然，一个变量不会是一个法则，而法则也不会是一个变量：二者的区分是很清晰的。

那我们回过头来，看看导数吧：\(f'(x_0)\)，它是一个完备的、在 \(f,x_0\) 确定后就能够唯一确定输出的法则吗？

好像，反常识地，这似乎是成立的；那么，我们常见的所谓的“对 \(x\) 求导”“对 \(t\) 求导”是什么意思呢？

这是因为，\(f(x)\) 中的 \(x\) 不一定是变量；如果 \(x\) 其实指的是一个函数 \(x(t)\)，那么 \(f(x(t))\) 就是以 \(t\) 为输入的一个法则。同理，套娃还可以继续下去，\(t\) 可以事实上是 \(t(y)\)，\(y\) 可以事实上是 \(y(r)\)……

打住。我们就在 \(r\) 这里停止，现在我们就认为我们的函数是 \(f(x(t(y(r))))\) 这个东西。其等效于另一个法则 \(g(r)\)，其与前面的一大坨有着相同的定义域和输出。此时，\(g(r)\) 可以定义其对应的导数，导数接受 \(r_0\) 作为输入，给出其在 \(r_0\) 处的导数。

我们将这种行为，定义为“\(f\) 关于 \(r\) 求导”。同理，还可以定义展开到 \(y,t,x\) 的“\(f\) 关于 \(y,t,x\) 求导”。

\(f\) 关于 \(r\) 求导，在 \(r_0\) 处的导数，按照 Leibniz 的记号可以记作 \(\left.\dfrac{\d f}{\d r}\right|_{r_0}\)。

需要注意的是，虽然 Leibniz 记号有着所谓“分数”的形式，但它并不是分数，应该把其视作一个整体，其整体表示在 \(r_0\) 处的导数。

而，\(\dfrac{\d f}{\d r}\) 则是一个函数，即为 \(f\) 关于 \(r\) 求导得到的函数。这是因为，一个函数 \(f\) 在 \(x_0\) 处的导数可以写作 \(\lim\limits_{\Delta x\to0}\dfrac{f(x_0+\Delta x)-f(x_9)}{(x_0+\Delta x)-x_0}=\lim\limits_{\Delta x\to0}\dfrac{\Delta f}{\Delta x}\)，其中将左侧的分子记作 \(\Delta f\)，然后对于 \(\dfrac{\Delta f}{\Delta x}\)“上下同趋于 \(0\)”这个过程记作 \(\dfrac{\d f}{\d x}\)。

此时我们回到 Lagrange 记号。在 Lagrange 记号下，导函数记作 \(f'_r\)，在 \(r_0\) 处的取值为 \(f'_r(r_0)\)。如果 \(r\) 本身就是 \(f\) 的自变量，也即如果是 \(f(r)\) 对 \(r\) 求导或是 \(f(x)\) 对 \(x\) 求导这种场合，下标的 \(r/x\) 可以扔掉，直接写 \(f'\) 表示导函数，\(f'(x_0)\) 表示其在 \(x_0\) 处的取值。

既然导数有着“关于某某变量求导”的说法，那么微分有没有呢？事实上，我们接下来将会看到，在一元微积分中，不论关于哪个变量微分，其都有相同的形式，即所谓的“微分的形式不变性”。

总结：微分记作 \(\d f(x_0)(h)\)（在 \(x_0,h\) 均确定后，其是一个常数）。如果是 \(\d f(x_0)\)，最后一维被扔掉了，那么指的是一个函数，也即 \(f\) 在 \(x_0\) 处微分的整个函数。\(\left.\dfrac{\d f}{\d r}\right|_{r_0}\) 是常数，\(\dfrac{\d f}{\d r}\) 是函数。

IV.恼人的省略

回到我们一开始给出的式子

\[\d y=\dfrac{\d y}{\d x}\d x \]

这个式子已经简略到了依照我们一开始的定义来看，完全无法理解的程度了。

它其实是一个这样的形式：首先 \(y\) 可以被看作是 \(y(x)\)，也即 \(y\) 是一个以 \(x\) 为自变量的函数；\(x\) 自身也是 \(x(x)\)，一个以 \(x\) 为自变量的函数。那么，上式的实际意义是：

对于 \(y(x)\) 定义域中的一切 \(x_0\)，都有 \(\d y(x_0)\) 这个函数是 \(\dfrac{\d y}{\d x}(x_0)\d x(x_0)\) 这个函数（前半部分是在 \(x_0\) 处的导数，一个常数；后半部分是一个函数）。
再展开一层，就是在 \(x_0\) 确定时，对于一切 \(h\)，都有 \(\d y(x_0)(h)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)(h)\)。

这个式子是易证的：因为易验证 \(\d x(x_0)(h)=h\)，按照定义 \(\dfrac{\d y}{\d x}(x_0)=\dfrac{\d y(x_0)(h)}{h}\)，于是上式自然成立。

为什么我们可以将 \(\d y(x_0)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)\) 简写成 \(\d y=\dfrac{\d y}{\d x}\d x\) 呢？这就是 早期数学家做事不严谨 的锅了。

事实上，这个式子的偏 Lagrange 形式的描述 \(\d y(x_0)=f'(x_0)\d x(x_0)\) 确实是较为严谨的。然后数学家就整出了 \(\d y(x)=f'(x)\d x\) 这样的花活：这个式子和前一个式子描述了同一个东西，只不过用 \(x\) 重命名了 \(x_0\)，且最后一个 \(\d x\) 使用了这样的约定：

如果 \(y=f(x)\)，那么 \(\d f(x)\) 可以被写成 \(\d y\)。
因此，\(x=x\)，那么 \(\d x(x)\) 可以被写成 \(\d x\)。
\(\d x(x)\) 这个描述，前一个 \(x\) 描述了微分对象是恒同映射 \(\tau (x)=x\)，后一个 \(x\) 表明在 \(x\) 处求微分，它们没有联系。

V.更多的省略

链索法则：

如果 \(y=f(z),z=g(y)\)，那么

\[\left.\dfrac{\d y}{\d x}\right|_{x_0}=\left.\dfrac{\d y}{\d z}\right|_{z_0}\times\left.\dfrac{\d z}{\d x}\right|_{x_0} \]

上式对于一切 \(x_0\) 成立，且 \(z_0=g(x_0)\)。

这其实根据我们前面的分析简单处理就能得到。

然后就是万恶的省略了。Leibniz 大手一挥，上式被简化成了这样：

\[\dfrac{\d y}{\d x}=\dfrac{\d y}{\d z}\times\dfrac{\d z}{\d x} \]

同时，因为 \(\d y=\dfrac{\d y}{\d z}\d z\)，\(\d z=\dfrac{\d z}{\d x}{\d x}\)，因此由链索法则我们得到了 \(\d y=\dfrac{\d y}{\d x}\d x\)。

于是，\(\d y=\dfrac{\d y}{\d z}\d z=\dfrac{\d y}{\d x}\d x\)，这被称作“一阶微分的形式不变性”。

我们把它尝试展开，就是如下的形式：

对于一切 \(x_0\) 和 \(z_0=g(x_0)\) 和一切 \(h\)，都有
\[\d y(z_0)(h)=\dfrac{\d y}{\d z}(z_0)\d z(z_0)(h)=\dfrac{\d y}{\d x}(x_0)\d x(x_0)(h) \]
这个式子其实是表明，无论“关于何值作微分”（也即式子 \(\dfrac{\d y}{\d t}\d t\)，\(t\) 是任意值），它们都相等，都等于所谓的 \(\d y\)。于是，微分就没有“关于某值微分”的概念：你关于任何值求导，由导数推出的微分都是相同的。

VI.不要给我自顾自地就开始省略啊喂！

如果 \(y=y(x)\)，且存在反函数 \(x=x(y)\)，那么在右式两边同时对 \(x\) 求导，得到 \(1=\dfrac{\d y}{\d x}\dfrac{\d x}{\d y}\)，所以 \(\dfrac{\d x}{\d y}=\dfrac1{\left(\dfrac{\d y}{\d x}\right)}\)。写成 Lagrange 的形式的话，就是若 \(y=f(x)\)，那么 \((f^{-1})'(y_0)=\dfrac1{f'(x_0)}\)，其中 \(y_0=f(x_0)\) 或者 \(x_0=f^{-1}(y_0)\)。

看着好像很对是吧？你要不要看看这个式子 \(1=\dfrac{\d y}{\d x}\dfrac{\d x}{\d y}\) 是坨什么东西？

事实上，左侧的 \(1\) 不是一个常数：它是一个函数。\(x\) 对 \(x\) 求导，得到的东西是常函数 \(1\)。

而右侧，其实是 \(x(y)\) 对 \(x\) 求导，使用链式法则的结果。

因此扩写应该是，\(1=\dfrac{\d y}{\d x}(x_0)\dfrac{\d x}{\d y}(y_0)\)，所以可以有上述的 Lagrange 形式。

\[\dfrac{\d}{\d x}y \]

这又是什么？

这也是导数。我们把 \(\dfrac\d{\d x}\) 看作是一个算子，这个算子作用于一个函数可以得到另一个函数（其导函数）。

于是二阶导

\[\dfrac{\d\left(\dfrac{\d y}{\d x}\right)}{\d x} \]

可以被写成

\[\dfrac\d{\d x}\dfrac\d{\d x}y \]

到目前为止，还好吧？

那么这个呢？

\[\dfrac{\d^2}{\d x^2}y \]

有点头晕了吧？这其实就是上面那个东西的省略。下面的 \(\d x^2\)，约定俗成地，如果在这种场合指的是 \((\d x)^2\) 而非 \(\d(x^2)\) 或者其它什么东西。

参数方程。

假定 \(y=y(t),x=x(t)\)，

且存在反函数 \(t=t(x)\)，

则 \(y=y(t(x))\)。

\[\dfrac{\d y}{\d x}=\dfrac{\d y}{\d t}\dfrac{\d t}{\d x}=\dfrac{\left(\dfrac{\d y}{\d t}\right)}{\left(\dfrac{\d x}{\d t}\right)} \]

还是得把式子拆开来。

\[\dfrac{\d y}{\d x}(x_0)=\dfrac{\d y}{\d t}(t_0)\dfrac{\d t}{\d x}(x_0)=\dfrac{\left(\dfrac{\d y}{\d t}\right)(t_0)}{\left(\dfrac{\d x}{\d t}\right)(t_0)} \]

第二项到第三项是用了之前证的反函数定理。

\[\dfrac{\d^2}{\d x^2}y=\dfrac{\d\left(\dfrac{\d y}{\d x}\right)}{\d x} \\=\dfrac{\d\left(\dfrac{\left(\dfrac{\d y}{\d t}\right)}{\left(\dfrac{\d x}{\d t}\right)}\right)}{\d x} \\=\dfrac{\left(\dfrac{\d x}{\d t}\right)\dfrac\d{\d x}\left(\dfrac{\d y}{\d t}\right)-\left(\dfrac{\d y}{\d t}\right)\dfrac\d{\d x}\left(\dfrac{\d x}{\d t}\right)}{\left(\dfrac{\d x}{\d t}\right)^2} \\=\dfrac{\dfrac{\d^2y}{\d t^2}-\left(\dfrac{\d y}{\d t}\right)\dfrac{\dfrac\d{\d t}\left(\dfrac{\d x}{\d t}\right)}{\dfrac{\d x}{\d t}}}{\left(\dfrac{\d x}{\d t}\right)^2} \\=\dfrac{y''_tx'_t-y'_tx''_t}{(x''_t)^3} \]

对于每一组匹配的 \((y_0,x_0,t_0)\)，有此式成立。

VII.通用的破译方法

对于一个复杂的、包含多个微分和导数的式子，你可以通过如下的方式来将一大坨已经省略得不成人样的式子破译：

首先，你的式子中涉及了若干个变量。取一组值 \((x_0,y_0,z_0,\dots)\)。因为我们是一元微积分，所以这一组值中须有一个核心的自变量，使得其确定后其它变量的值也随即确定。

然后，对于你式子中的微分，将其后面补上第一个括号，为其自变量对应的 \(x_0\)（或者 \(y_0,z_0\) 抑或是其它东西）。然后补上第二个括号 \((h)\)。

对于你式子中的导数 \(\dfrac{\d m}{\d n}\)，后面补上括号 \((n_0)\)。

这样，我们便得到一个破译完成的式子：其是一个值等于另一个值的形式。

VIII.尾声

感觉自己写了一坨答辩。

评价为：眼高手低，把很简单的东西整的过于复杂。

有必要纠正想到哪写到哪、遇事不决先开写的坏习惯了。

posted @ 2023-11-14 20:56 Troverld 阅读(311) 评论(5) 编辑收藏举报

刷新页面返回顶部

Troverld

博客渲染出问题了那是博客的锅，本人什么都不会做的。