【微积分】 05 - 多元微分

1. 多元函数

1.1 欧几里得空间

  很多函数的自变量不止一个,现在就来讨论这种函数的性质,多元函数可以记作\(f(x_1,\cdots,x_n)\)。如果只是独立地讨论函数与每个变量的关系,大可不必给出新的概念,我们需要把所有自变量当成一个“数”看待,并研究这种函数的分析特性。对于这种数,我们还需要“距离”、“长度”的概念,线性代数中提到的欧几里得空间正好符合要求,请复习相关内容。

  为简单起见,这里默认在标准正交基下讨论,并用直接向量坐标代表向量本身(一般说成点),这也更符合使用习惯。但要注意,这里的结论对任何欧几里得空间、以及任何一组正交基都是成立的。具体来说,向量写成\(\vec{x}=(x_1,\cdots,x_n)\),向量的距离定义为式(1),向量的长度范数)记为\(\left\|\vec{x}\right\|\),空间记作\(\Bbb{R}^n\)。所有满足\(\rho(\vec{x},\vec{x}_0)<\delta\)的点称为开球,而所有满足\(|x_i-x_{0i}|<\delta\)的点称为开正方体,它们都可以作为\(\vec{x}_0\)的\(\delta\)-邻域的概念,且使用起来是等价的。

\[\rho(\vec{x},\vec{y})=\sqrt{(x_1-y_1)^2+\cdots+(x_n-y_n)^2}\tag{1}\]

  为描述方便,我们需要定义一些关于点集\(S\)概念。如果\(\vec{x}_0\)的某个领域被包含在\(S\)中,\(\vec{x}_0\)称为\(S\)的内点,领域与\(S\)无交集的叫外点,其它的叫边界点。任何点都是这三者之一,其中内点必定属于\(S\),外点必定不属于\(S\),边界点两种都有可能。去心领域与\(S\)总有交集的点叫聚点,否则叫孤立点,聚点可能是内点,也可能是非孤立的边界点。如果\(S\)的每一点都是内点,\(S\)被称为开集,开集的补集称为闭集,其实闭集等价于包含所有聚点的集合。相对于区间的概念,如果\(S\)中任何两个点可连通(通过自身的点相连),它被称为区域,自然还可定义开区域闭区域

  一元函数的分析学性质都依赖实数的完备性,所以需要验证向量是否有类似的性质。首先容易定义柯西点列基本点列),然后再定义极限\(\vec{x}_n\to\vec{x}_0\),并证明极限存在的充要条件是柯西点列。极限存在则必定唯一,以上聚点就是一种极限点。可以证明极限存在等价于在每一维有极限,完备性的证明都利用了在一维的性质,故这里不再详细证明。完备性相关定义有:闭集套开覆盖紧集有界点集(列),相应地定理有:闭集套定理有限覆盖定理子列收敛定理,证明从略。

1.2 多元函数的连续性

  类似于一元函数,我们要讨论多元函数的连续性、可微性。讨论中可以以二元函数作为直观例子,并记之为\(z=f(x,y)\),它们容易扩展到更高维。连续性首先要定义函数极限,即当\((x,y)\to(a,b)\)时,\(f(x,y)\)存在极限\(z_0\),记作\(f(x,y)\to z_0\),当然也可以用\(\epsilon\)-\(\delta\)语言定义。但要注意,函数极限是一个有聚点的点集的性质,不能以某条线路作为极限的依据,当然也不能逐维求极限。为此我们把极限(2)式后两个称为累次极限,而第一个称为重极限

\[\lim\limits_{x\to a,\,y\to b}{f(x,y)}\:\ne\:\lim\limits_{x\to a}{\lim\limits_{y\to b}{f(x,y)}}\:\ne\:\lim\limits_{y\to b}{\lim\limits_{x\to a}{f(x,y)}}\tag{2}\]

  累次极限和重极限在特定情况下是相同的,但很多时候它们没有什么关系,你可以借助二元的函数的直观图形论证(点\((0,0)\))。两个累次极限不一定相等(\(\dfrac{x-y+x^2+y^2}{x+y}\)),甚至其中一个没有极限(\(x\sin{\dfrac{1}{x}}\))。累次极限存在且相等,重极限也不一定存在(\(\dfrac{xy}{x^2+y^2}\)),反之重极限存在,累次极限也不一定存在(\(x\sin{\dfrac{1}{x}}\))。但可以证明,如果重极限\(A\)存在或为无穷,且\(y\ne b\)时\(\lim\limits_{x\to a}{f(x,y)}\)存在极限\(\varphi(y)\),则对应的累次极限也存在且与重积分相同(式(3))。

\[\lim\limits_{x\to a,\,y\to b}{f(x,y)}=A\:\wedge\:\lim\limits_{x\to a}{f(x,y)}=\varphi(y),\:(y\ne b)\quad\Rightarrow\quad\lim\limits_{y\to b}{\lim\limits_{x\to a}{f(x,y)}}=A \tag{3}\]

  有了极限的概念,自然可以给出连续的定义,当\((x,y)\to(a,b)\)时若\(f(x,y)\to f(a,b)\),称\(f(x,y)\)在\((a,b)\)连续。处处连续的函数称为连续函数,可以证明连续函数的组合函数还是连续的。容易证明,函数在连续点的足够小邻域内有界,如果\(f(a,b)>0(<0)\),则在\((a,b)\)足够小邻域内也有\(f(x,y)>0(<0)\)。

  多元连续函数有着与一元连续函数类似的性质,证明也类似,这里仅作陈列。(1)零点定理:如果函数在区域的某两点异号,则必存在值为零的点;(2)介值定理:区域中存在两点间任意值的点;(3)有界性定理:有界闭集上的连续函数有界;(4)最值定理:有界闭集上的连续函数有最大值和最小值。多元函数也可以定义一致连续,并且同样有结论:有界闭集上的连续函数一致连续。

2. 多元微分

2.1 全微分和偏微分

  连续性之后自然是研究可微性,它表示某点相对于领域的平滑性。首先我们当然也可以为每一维定义微分(导数),但它并不是相对于邻域的性质,为了区别开来,将某一维(比如\(x\))的导数称为偏导数,记作\(\dfrac{\partial f}{\partial x}(x,y),\,f'_x(x,y)\)或\(f_x(x,y)\)。偏导数仅表示函数在每一维的变化趋势(切线),它不能表示函数在该点的平滑性,所谓平滑其实就是说在局部近似一个平面(二元函数),而要确定这个平面我们需要两条直线。

  为此,自然可以想到按如下方法定义微分,设函数\(z=f(x,y)\)在区域内点\((x_0,y_0)\)满足式(4),称函数在\((x_0,y_0)\)处可微。其实容易证明,定义中的\(o(\rho)\)可以替换为\(o(\varDelta x)+o(\varDelta y)\)。显然可微函数在\((x_0,y_0)\)处存在偏导数,且满足\(f'_x(x_0,y_0)=A,f'_y(x_0,y_0)=B\)。但偏导数存在并不表示可微(\(\sqrt{|xy|}\)),甚至都不一定连续。考察式(5)对\(\varDelta z\)的变形,如果\(f'_x,f'_y\)在\((x_0,y_0)\)的一个领域内都存在且在\((x_0,y_0)\)连续,利用微分中值定理容易证明\(f(x,y)\)可微。

\[\varDelta z=A\varDelta x+B\varDelta y+o(\rho),\quad(\rho=\sqrt{(\varDelta x)^2+(\varDelta y)^2})\tag{4}\]

\[\varDelta z=[f(x_0+\varDelta x,y_0+\varDelta y)-f(x_0,y_0+\varDelta y)]+[f(x_0,y_0+\varDelta y)-f(x_0,y_0)]\tag{5}\]

  类似地,我们把式(4)中的线性部分称为\(f(x,y)\)在区域内点\((x_0,y_0)\)的全微分,记作\(\text{d}f\),而\(A\varDelta x\)称为关于\(x\)的偏微分,记作\(\text{d}_x\,f\)(式(6))。由此,偏导数还可以写作式(7),它也被偏微商。在定义域内处处可微的函数称为可微函数,偏导数都连续的(必定可微)函数称为连续可微,一般记作\(f(x,y)\in C^1\)。

\[\text{d}f(x,y)=\text{d}_xf(x,y)+\text{d}_yf(x,y)=f'_x(x,y)\,\text{d}x+f'_y(x,y)\,\text{d}y\tag{6}\]

\[f'_x(x,y)=\dfrac{\text{d}_xf(x,y)}{\text{d}x};\quad f'_y(x,y)=\dfrac{\text{d}_yf(x,y)}{\text{d}y}\tag{7}\]

2.2 链锁法则及其应用

  偏导数的计算与一般导数无异,但对于复合函数,我们可以将一元函数中的链锁法则进行扩展。为简单起见,先设\(z=f(x,y)\)可微且有\(x=x(t),y=y(t)\),再假设\(x'(t),y'(t)\)存在且有界。当\(\varDelta t\to 0\)时可有\(\varDelta x\to 0,\varDelta y\to 0\),从而式(4)成立,两边除以\(\varDelta t\)可得式(8)。这个公式的好处是将函数分割为几个维度来处理,比如对于\(f(t)^{g(t)}\)的函数就不必变形而直接使用\(x^y\)的结论。当\(x,y\)为多元函数时,偏导数有同样的结论。

\[\dfrac{\text{d}z}{\text{d}t}=\dfrac{\partial z}{\partial x}\dfrac{\text{d}x}{\text{d}t}+\dfrac{\partial z}{\partial y}\dfrac{\text{d}y}{\text{d}t}\tag{8}\]

  一元函数的链锁法则得到了一元微分的形式不变性,这个结论在多元函数中仍然成立。设\(z=f(x,y),x(u,v),y(u,v)\)都连续可微,首先易证在领域内\(x,y\)对\(u,v\)的偏导数有界,从而\(z\)对\(u,v\)的偏导数存在且连续。将\(z'_u,z'_v\)的链锁表达式带入\(\text{d}z=z'_u\,\text{d}u+z'_v\,\text{d}v\),整理后容易得到式(6),这就说明了多元微分也有形式不变性,它使得求偏导数更加方便。

  现在来看看对于多元函数,是否有中值定理。设\(f(x,y)\)可微,取两点\(M_0=(x_0,y_0),M_1=(x_0+\varDelta x,y_0+\varDelta y)\),考察直线\(x=x_0+t\varDelta x,y=y_0+t\varDelta y\)上的值\(F(t)\)(当然还要求直线都在定义域内)。利用拉格朗日中值定理可知\(F(1)-F(0)=F'(\theta)\),而由链锁法则可有式(9)成立。特别地,如果区域内\(f'_x,f'_y\)恒为零,则\(f(x,y)\)为常数。

\[f(x_0+\varDelta x,y_0+\varDelta y)-f(x_0,y_0)=f'_x(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta x+f'_y(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta y\tag{9}\]

2.3 高阶微分

  偏导数函数本身当然也可以存在偏导数,它们被称为二阶偏导数,它的记法如式(10)所示。要注意混合偏导数中变量的次序,不同的次序的偏导数不一定相等(\(xy\dfrac{x^2-y^2}{x^2+y^2}\))。为弄清原因,用极限式表示两种次序的混合偏导数(式(11),其中\(w(h,k)=f(x_0+h,y_0+k)-f(x_0+h,y_0)-f(x_0,y_0+k)+f(x_0,y_0)\)),容易看出结果不同原因,本质上是累次极限的不同。

\[\dfrac{\partial}{\partial y}\left({\dfrac{\partial f}{\partial x}}\right)=\dfrac{\partial^2 f}{\partial y\partial x}=f''_{xy};\quad\dfrac{\partial}{\partial x}\left({\dfrac{\partial f}{\partial x}}\right)=\dfrac{\partial^2 f}{\partial x^2}=f''_{xx}=f''_{x^2}\tag{10}\]

\[f''_{xy}=\lim\limits_{k\to 0}{\lim\limits_{h\to 0}{\dfrac{w(h,k)}{hk}}};\quad f''_{yx}=\lim\limits_{h\to 0}{\lim\limits_{k\to 0}{\dfrac{w(h,k)}{hk}}}\tag{11}\]

  为得到两者相等的充分条件,可以利用式(3)的结论。首先假定\(f''_{xy},f''_{yx}\)在\((x_0,y_0)\)领域内存在,然后两次利用微分中值定理可得式(12)。按照式(3)的假设,还需要求\(f''_{xy}\)在\((x_0,y_0)\)处连续,这样\(\dfrac{w(h,k)}{hk}\)就存在重极限。而单独\(h\to 0\)时显然也存在极限,从而得到累加极限(11)相等且等于重极限。

\[w(h,k)=f''_{xy}(x_0+\theta_1h,y_0+\theta_2k),\quad(1<\theta_1,\,\theta_2<1)\tag{12}\]

  高阶偏导数可以同样定义,且易知当\(f(x,y)\)的\(n\)阶混合偏导数都连续时,变量的顺序就不影响结果,偏导数就可以写成\(\dfrac{\partial^nf}{\partial^{i}x\partial^{n-i}y}\)。求高阶偏导数只是多次求一阶偏导数,故求解中可以继续使用链锁法则。更进一步地,如果\(f(x,y)\)的二阶偏导数存在且连续,则全微分(式(6))中的\(f'_x,f'_y\)的偏导数连续,从而\(\text{d}z\)也是可微的。记二阶全微分\(\text{d}^2z=\text{d}(\text{d}z)\),容易推导出式(13)成立。

\[\text{d}^2z=\dfrac{\partial^2z}{\partial x^2}\text{d}x^2+2\dfrac{\partial^2z}{\partial x\partial y}\text{d}x\text{d}y+\dfrac{\partial^2z}{\partial y^2}\text{d}y^2\tag{13}\]

  推导过程中容易发现,如果忽略符号\(z\),符号\(X=\text{d}x\dfrac{\partial}{\partial x}\)和\(Y=\text{d}y\dfrac{\partial}{\partial y}\)可以看作是两个整体,求全微分的过程就像是多项式乘上\((X+Y)\)。这个过程对任何高阶全微分都成立,为了书写方便,可以将\(\text{d}^nz\)形式地写成式(14)。该式仅是形式上的简化,并不能简化实际计算过程。还要注意,高阶全微分的形式对中间变量的形式不变性不再成立。

\[\text{d}^nz=(\text{d}x\dfrac{\partial}{\partial x}+\text{d}y\dfrac{\partial}{\partial y})^nz\tag{14}\]

  当\(f(x,y)\in C^{n+1}\)时(有直到\(n+1\)阶的连续偏导数),设\(F(t)=f(x_0+t\varDelta x,y_0+t\varDelta y)\),对\(F(t)\)使用带拉格朗日余项的泰勒公式,可得多元函数的泰勒公式(15)。当\(f(x,y)\in C^n\)时,还可以利用式(15)得到皮亚诺余项\(o(\rho^n)\)。泰勒公式也能用来求多元函数的近似值。

\[F(1)=\sum\limits_{n=0}^n{\dfrac{1}{i!}\varDelta^i}F(0)+\dfrac{1}{(n+1)!}\varDelta^{n+1}F(\theta),\quad\varDelta^i=(\varDelta x\dfrac{\partial}{\partial x}+\varDelta y\dfrac{\partial}{\partial y})^i\tag{15}\]

2.4 隐函数

  前面我们已经看到过,有时变量的关系是以\(F(x,y)=0\)这样的等式呈现的,并且无法或很难写成显式的\(y=f(x)\)。考察\(x^2-y^2=0\),它在除原点外的局部其实都有函数关系式\(y=f(x)\),这样的函数我们称之为由\(F(x,y)=0\)定义的隐函数。既然无法显式地写出\(f(x)\),它的连续和微分性质只能通过\(F(x,y)\)讨论,这里就来讨论一下这些问题。

  首先要注意,隐函数是在局部讨论的(这样讨论的范围更广),所以设\(F(x_0,y_0)=0\)而讨论\((x_0,y_0)\)的邻域。我们希望在\(x_0\)的某个邻域内的\(x'\),有唯一的\(y'\)使得\(F(x',y')=0\)。(以下讨论以函数图形为参考更好理解)最容易想到的是连续函数的零点定理,为此先假定\(F(x,y)\)在\((x_0,y_0)\)的邻域内连续。然后要构造\(f(x',y_0\pm\varDelta y)\)是异号的,为此只要假定\(f(x',y)\)在局部关于\(y\)单调,因为这样的话\(f(x_0,y_0\pm\varDelta y)\)异号,在足够小的邻域内也会有\(f(x',y_0\pm\varDelta y)\)异号。

  由\(F(x_0,y)\)的单调性和\(F(x,y)\)的连续性还容易证明(反证),\(x'\to x_0\)时必定有\(y'\to y_0\)。从而\(f(x)\)在\((x_0,y_0)\)连续,同样可以证明在邻域内都是连续的。总结以上便有,如果\(F(x,y)\)满足\(F(x_0,y_0)=0\),且在\((x_0,y_0)\)的邻域里连续,还有关于\(y\)单调,那么在这个邻域内存在连续的隐函数\(y=f(x)\)。其中关于\(y\)单调的条件可以加强为:\(F'_y\)在\((x_0,y_0)\)的邻域里存在且有单一符号,或者更强的条件是:\(F'_y\)在\((x_0,y_0)\)处连续且非零。

  如果还要使\(f(x)\)在点\((x_0,y_0)\)处可微,其实就是讨论\(\varDelta x,\varDelta y\)的关系,容易想到式(9)的中值定理。为此先要假设\(F'_x,F'_y\)在邻域内连续(从而可微),利用中值定理可得式(16),表示成\(\dfrac{\varDelta y}{\varDelta x}\)后利用\(F'_x,F'_y\)的连续性可得式(17)。总结就是说,如果在\((x_0,y_0)\)的一个邻域内\(F,F'_x,F'_y\)都连续,且\(F'_y(x_0,y_0)\ne 0\),则在这个邻域内有可微隐函数,且导数为式(17),导数也是连续的。以上两个结论对多元函数\(F(x_1,\cdots,x_n,y)\)同样成立,证明也类似,请自行描述且论证。

\[0=F(x',y')-F(x_0,y_0)=F'_x(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta x+F'_y(x_0+\theta\varDelta x,y_0+\theta\varDelta y)\varDelta y\tag{16}\]

\[y'_x=-\dfrac{F'_x(x,y)}{F'_y(x,y)}\tag{17}\]

3. 向量值函数

  当多个函数\(f_1,\cdots,f_m\)依赖于同一组自变量\(x_1,\cdots,x_n\)时,可以将\((f_1,\cdots,f_m)\)做为一个向量看待,函数\(\vec{f}(\vec{x})\)被称为向量值函数。这种函数其实可以拆成独立的多元函数分别研究,所以我们仅专注一些有漂亮形式特点的结论。诸如极限、连续的概念都比较简单,其实向量值函数连续等价于每个多元函数分别连续,这里不作赘述。

  类似地,当每个多元函数可微时,也称向量值函数可微。如果用\(\text{d}\vec{f},\,\text{d}\vec{x}\)表示微分,而偏微分组成的矩阵(18)称为雅克比矩阵,则可微函数有式(19)成立,这里的雅克比矩阵起到了类似导数的作用。如果有\(\vec{z}=\vec{f}(\vec{y}),\,\vec{y}=\vec{g}(\vec{x})\),且\(\vec{f},\vec{g}\)的偏导数连续,同样有式(20)左的链锁法则成立,且易知一阶微分的形式不变性也成立(式(20)右)。

\[J\,[\,\vec{f}(\vec{x})\,]=\begin{bmatrix}\dfrac{\partial f_1}{\partial x_1}&\cdots&\dfrac{\partial f_1}{\partial x_n}\\\vdots&\ddots&\vdots\\\dfrac{\partial f_m}{\partial x_1}&\cdots&\dfrac{\partial f_m}{\partial x_n}\end{bmatrix};\quad |J_n|=\dfrac{\partial(f_1,\cdots,f_n)}{\partial(x_1,\cdots,x_n)}\tag{18}\]

\[\text{d}\vec{f}\,=\,J\,[\,\vec{f}(\vec{x})\,]\,\text{d}\vec{x}\tag{19}\]

\[J\,[\,\vec{f}\circ\vec{g}\,]=J\,[\,\vec{f}\,]\cdot J\,[\,\vec{g}\,];\quad \text{d}\vec{z}=J\,[\,\vec{f}\circ\vec{g}\,]\,\text{d}\vec{x}=J\,[\,\vec{f}\,]\,\text{d}\vec{y}\tag{20}\]

  上面的隐函数的结论在向量值函数中仍然成立,比如向量值函数\(\vec{F}(\vec{x},\vec{y})\)的定义域为\(n+m\)维,值域为\(m\)维,设\(\vec{F}\)及其一阶偏导数都连续,另外\(\vec{F}\)在\((\vec{x}_0,\vec{y}_0)\)处值为\(0\)且对于\(\vec{y}\)的雅克比行列式\(|J_m|=\dfrac{\partial\vec{F}}{\partial\vec{y}}\)非零,那么方程组\(\vec F\equiv 0\)在\((\vec{x}_0,\vec{y}_0)\)附近确定唯一的隐函数\(\vec{y}=\vec{f}(\vec{x})\)。可以由\(|J_m|\ne 0\)非零先找到某个\(\dfrac{\partial F_i}{\partial y_m}\ne 0\),并由条件确定唯一隐函数\(y_m=\varphi(x_1,\cdots,y_{m-1})\),带入其它\(m-1\)个方程便将问题降到\(m-1\)维。用连锁法则对\(J_m\)变形即能证明新的雅克比行列式也非零,故用归纳法能得到唯一的隐函数,且在局部连续。

  类似式(16)的讨论,可以在每个\(F_i=0\)上对\(x_j\)求导,得到\(mn\)个方程组(21)。由于\(|J_m|\ne 0\),由克莱姆法则可解得隐函数的所有偏导数(式(22))。

\[\dfrac{\partial F_i}{\partial x_j}+\dfrac{\partial F_i}{\partial y_1}\cdot\dfrac{\partial y_1}{\partial x_j}+\cdots+\dfrac{\partial F_i}{\partial y_m}\cdot\dfrac{\partial y_m}{\partial x_j}=0\tag{21}\]

\[\dfrac{\partial y_j}{\partial x_i}=-{\dfrac{\partial\vec{F}}{\partial\vec{y}_{ij}}}\left/{\dfrac{\partial\vec{F}}{\partial\vec{y}}}\right.,\quad\vec{y}_{ij}=(\cdots,y_{j-1},x_i,y_{j+1},\cdots)\tag{22}\]

posted on 2016-03-03 08:59  卞爱华  阅读(2115)  评论(0编辑  收藏  举报

导航