深感文字之乏力与思绪之混乱

原计划标题为《深感数学改革之必要性》,但是写完之后决定改成现在的标题。

看不懂不用说,是我太拉了。

I.前言

前些日子微积分课上学习了微分。当时糊里糊涂就糊弄过去了,听着也挺对的,后面的求导、中值定理之流也没有任何影响:主要是因为,在绝大部分时候,我们在意的都是 导数 而非 微分。导数就像一个被精美包装过的黑匣子:无论是复合、乘法还是除法,抑或是高阶导数、泰勒展开,都可以以 Lagrange 的符号系统,简简单单地用几个 解决问题。

但是,当我们逐渐深入微积分后,我们将会发现,导数是不可靠的:积分、偏导、多元微积分……越来越多的知识跳脱出了那方精巧的黑匣子,不再囿于 Lagrange 的 的束缚。我们必须跳出导数的概念,去探索那狂野的、纯真的微分,寻找那原始的美。

II.楔子

不知道大家有没有见过一个式子,所谓的“小学生也能懂的微积分”:

dy=dydxdx

乍一看,这确实是极其明了的了:上下约分自然成立。

但是,首先,这并不是约分;其次,这似乎与我们一开始的“微分”的定义有些许的差别。

III.引入

一个一元函数 f(x) 是线性函数,如果它满足 f(λx+μy)=λf(x)+μf(y) 对于全体 x,y,λ,μR 均成立。

一个线性函数总是可以写成如下的形式:f(x)=λx,其中 λ 被称作其 比例系数

一个点是定义域的内点,当且仅当其存在一个邻域,使得邻域中所有元素都有定义。

对于 f(x) 的一个内点 x0,定义一个线性函数 L(h) 是其 微分,若满足 f(x0+h)=f(x0)+L(h)+o(h),h0 成立。

此时,我们定义 df(x0)(h):=L(h)。同时定义其 导数 f(x0)L(h) 的比例系数。也即,f(x0)=L(h)h

我们首先要牢记一点:即,df(x0)(h) 永远是一个 法则,它根据输入的 x0,h 来唯一输出一个值。这个法则是相当完备的:它仅依靠 f,x0,h 三者就能唯一确定输出。而 f 是什么?f 是另一个 法则,它接受一个输入以唯一给出一个输出。可以发现,这里我们说的法则,其实就是常规而言的 函数。为什么我避免使用函数呢?因为函数和变量之间的混用情况太多了,正如 y=kx+b 其实是指 y=y(x),其中 y(x) 是一个函数(法则),其针对输入 x 给出了唯一的输出 kx+b。为了避免这种积重难返的混用,我在此处用 法则 来代指一个函数。显然,一个变量不会是一个法则,而法则也不会是一个变量:二者的区分是很清晰的。

那我们回过头来,看看导数吧:f(x0),它是一个完备的、在 f,x0 确定后就能够唯一确定输出的法则吗?

好像,反常识地,这似乎是成立的;那么,我们常见的所谓的“对 x 求导”“对 t 求导”是什么意思呢?

这是因为,f(x) 中的 x 不一定是变量;如果 x 其实指的是一个函数 x(t),那么 f(x(t)) 就是以 t 为输入的一个法则。同理,套娃还可以继续下去,t 可以事实上是 t(y)y 可以事实上是 y(r)……

打住。我们就在 r 这里停止,现在我们就认为我们的函数是 f(x(t(y(r)))) 这个东西。其等效于另一个法则 g(r),其与前面的一大坨有着相同的定义域和输出。此时,g(r) 可以定义其对应的导数,导数接受 r0 作为输入,给出其在 r0 处的导数。

我们将这种行为,定义为“f 关于 r 求导”。同理,还可以定义展开到 y,t,x 的“f 关于 y,t,x 求导”。

f 关于 r 求导,在 r0 处的导数,按照 Leibniz 的记号可以记作 dfdr|r0

需要注意的是,虽然 Leibniz 记号有着所谓“分数”的形式,但它并不是分数,应该把其视作一个整体,其整体表示在 r0 处的导数。

而,dfdr 则是一个函数,即为 f 关于 r 求导得到的函数。这是因为,一个函数 fx0 处的导数可以写作 limΔx0f(x0+Δx)f(x9)(x0+Δx)x0=limΔx0ΔfΔx,其中将左侧的分子记作 Δf,然后对于 ΔfΔx“上下同趋于 0”这个过程记作 dfdx

此时我们回到 Lagrange 记号。在 Lagrange 记号下,导函数记作 fr,在 r0 处的取值为 fr(r0)。如果 r 本身就是 f 的自变量,也即如果是 f(r)r 求导或是 f(x)x 求导这种场合,下标的 r/x 可以扔掉,直接写 f 表示导函数,f(x0) 表示其在 x0 处的取值。

既然导数有着“关于某某变量求导”的说法,那么微分有没有呢?事实上,我们接下来将会看到,在一元微积分中,不论关于哪个变量微分,其都有相同的形式,即所谓的“微分的形式不变性”。

总结:微分记作 df(x0)(h)(在 x0,h 均确定后,其是一个常数)。如果是 df(x0),最后一维被扔掉了,那么指的是一个函数,也即 fx0 处微分的整个函数。dfdr|r0 是常数,dfdr 是函数。

IV.恼人的省略

回到我们一开始给出的式子

dy=dydxdx

这个式子已经简略到了依照我们一开始的定义来看,完全无法理解的程度了。

它其实是一个这样的形式:首先 y 可以被看作是 y(x),也即 y 是一个以 x 为自变量的函数;x 自身也是 x(x),一个以 x 为自变量的函数。那么,上式的实际意义是:

  • 对于 y(x) 定义域中的一切 x0,都有 dy(x0) 这个 函数dydx(x0)dx(x0) 这个函数(前半部分是在 x0 处的导数,一个常数;后半部分是一个函数)。
  • 再展开一层,就是在 x0 确定时,对于一切 h,都有 dy(x0)(h)=dydx(x0)dx(x0)(h)

这个式子是易证的:因为易验证 dx(x0)(h)=h,按照定义 dydx(x0)=dy(x0)(h)h,于是上式自然成立。

为什么我们可以将 dy(x0)=dydx(x0)dx(x0) 简写成 dy=dydxdx 呢?这就是 早期数学家做事不严谨 的锅了。

事实上,这个式子的偏 Lagrange 形式的描述 dy(x0)=f(x0)dx(x0) 确实是较为严谨的。然后数学家就整出了 dy(x)=f(x)dx 这样的花活:这个式子和前一个式子描述了同一个东西,只不过用 x 重命名了 x0,且最后一个 dx 使用了这样的约定:

  • 如果 y=f(x),那么 df(x) 可以被写成 dy
  • 因此,x=x,那么 dx(x) 可以被写成 dx
  • dx(x) 这个描述,前一个 x 描述了微分对象是恒同映射 τ(x)=x,后一个 x 表明在 x 处求微分,它们没有联系。

V.更多的省略

链索法则:

如果 y=f(z),z=g(y),那么

dydx|x0=dydz|z0×dzdx|x0

上式对于一切 x0 成立,且 z0=g(x0)

这其实根据我们前面的分析简单处理就能得到。

然后就是万恶的省略了。Leibniz 大手一挥,上式被简化成了这样:

dydx=dydz×dzdx

同时,因为 dy=dydzdzdz=dzdxdx,因此由链索法则我们得到了 dy=dydxdx

于是,dy=dydzdz=dydxdx,这被称作“一阶微分的形式不变性”。

我们把它尝试展开,就是如下的形式:

  • 对于一切 x0z0=g(x0) 和一切 h,都有

    dy(z0)(h)=dydz(z0)dz(z0)(h)=dydx(x0)dx(x0)(h)

    这个式子其实是表明,无论“关于何值作微分”(也即式子 dydtdtt 是任意值),它们都相等,都等于所谓的 dy。于是,微分就没有“关于某值微分”的概念:你关于任何值求导,由导数推出的微分都是相同的。

VI.不要给我自顾自地就开始省略啊喂!

如果 y=y(x),且存在反函数 x=x(y),那么在右式两边同时对 x 求导,得到 1=dydxdxdy,所以 dxdy=1(dydx)。写成 Lagrange 的形式的话,就是若 y=f(x),那么 (f1)(y0)=1f(x0),其中 y0=f(x0) 或者 x0=f1(y0)

看着好像很对是吧?你要不要看看这个式子 1=dydxdxdy 是坨什么东西?

事实上,左侧的 1 不是一个常数:它是一个函数。xx 求导,得到的东西是常函数 1

而右侧,其实是 x(y)x 求导,使用链式法则的结果。

因此扩写应该是,1=dydx(x0)dxdy(y0),所以可以有上述的 Lagrange 形式。

ddxy

这又是什么?

这也是导数。我们把 ddx 看作是一个算子,这个算子作用于一个函数可以得到另一个函数(其导函数)。

于是二阶导

d(dydx)dx

可以被写成

ddxddxy

到目前为止,还好吧?

那么这个呢?

d2dx2y

有点头晕了吧?这其实就是上面那个东西的省略。下面的 dx2,约定俗成地,如果在这种场合指的是 (dx)2 而非 d(x2) 或者其它什么东西。


参数方程。

假定 y=y(t),x=x(t)

且存在反函数 t=t(x)

y=y(t(x))

dydx=dydtdtdx=(dydt)(dxdt)

还是得把式子拆开来。

dydx(x0)=dydt(t0)dtdx(x0)=(dydt)(t0)(dxdt)(t0)

第二项到第三项是用了之前证的反函数定理。

d2dx2y=d(dydx)dx=d((dydt)(dxdt))dx=(dxdt)ddx(dydt)(dydt)ddx(dxdt)(dxdt)2=d2ydt2(dydt)ddt(dxdt)dxdt(dxdt)2=ytxtytxt(xt)3

对于每一组匹配的 (y0,x0,t0),有此式成立。

VII.通用的破译方法

对于一个复杂的、包含多个微分和导数的式子,你可以通过如下的方式来将一大坨已经省略得不成人样的式子破译:

首先,你的式子中涉及了若干个变量。取一组值 (x0,y0,z0,)。因为我们是一元微积分,所以这一组值中须有一个核心的自变量,使得其确定后其它变量的值也随即确定。

然后,对于你式子中的微分,将其后面补上第一个括号,为其自变量对应的 x0(或者 y0,z0 抑或是其它东西)。然后补上第二个括号 (h)

对于你式子中的导数 dmdn,后面补上括号 (n0)

这样,我们便得到一个破译完成的式子:其是一个值等于另一个值的形式。

VIII.尾声

感觉自己写了一坨答辩。

评价为:眼高手低,把很简单的东西整的过于复杂。

有必要纠正想到哪写到哪、遇事不决先开写的坏习惯了。

posted @   Troverld  阅读(345)  评论(5编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示