微分方程、动力系统与混沌导论 第7章 非线性系统[书摘]
第7章 非线性系统
在本章,我们开始研究非线性微分方程。对于系统(常系数)系统,我们总可以找到任一初值问题的显式解,对于非线性系统,这种情况相当少见。事实上,一些基本性质,例如解的存在唯一性,在线性情形下是显然的,而在非线性情形则不再成立。我们将看到,有些非线性系统甚至对任何初值问题都无解。另一方面,有些系统却有无穷多个不同解。而且即使找到这样系统的一个解,它也不一定对所有时刻有定义。例如,解有可能在有限时间就趋于$\infty$。随之而来,问题就产生了:例如,当系统的初始条件发生哪怕一点微小变化时,将会发生什么?相应的解会连续变化吗?所有的这些问题对线性系统都是清楚的,而对非线性系统则未必。这意味着非线性微分方程的基本理论要比线性的复杂得多。
实际中产生的大部分非线性系统都是“好的”,也就是说,它们具有解的存在唯一性,当初始条件改变时,解也会随之而连续变化,其它的“自然”性质也将发生变化。这样,我们就得面临一个选择:给定一个非线性系统,我们要么简单地向前进行,寄希望(或者去验证)在每一种特定情形,系统解的行为都很好;在此刻停下来,花些时间来阐述一些必要的假设,以保证给定的非线性系统解的行为很好。
7.1 动力系统
大多数的非线性微分方程系统不可能解析地求解。原因之一就是,我们没有足够多具有特定名称的函数来写出这些系统的显式解。同样困难的是,我们将看到,高维系统可能产生混沌行为,这种性质使得即使知道了显式解,也不会对我们理解系统的整体行为有什么实质性的帮助(为什么呢?)。于是,为了理解这些系统,我们被迫去寻找另外的办法,这就是在动力系统领域出现的各种技巧。我们将综合应用分析的、几何的以及拓扑的技巧来得到有关这些方程解的行为的严格结果。
动力系统是一种描述一个给定空间$S$中所有点随时间旅程的方法。空间$S$可以看成是,比如,某个物理系统的状态空间。数学上,$S$可能是欧几里得空间,也可能是欧几里得空间的一个开子集(为什么要强调是开呢?),或一些其它空间,如$\mathbb R^3$中的曲面。当我们考虑力学中产生的动力系统时,空间$S$将是系统所有可能的位置和速度。为了简单起见,我们将始终假设空间$S$就是欧几里得空间$\mathbb R^n$,但在某些情形,重要的动力行为只局限在$\mathbb R^n$的一个特定子集上。
给定一个初始位置$\boldsymbol X \in \mathbb R^n$,$\mathbb R^n$上的一个动力系统会告诉我们$\boldsymbol X$在1个单位时间后在哪里,2个单位时间在哪里,等等。我们将$\boldsymbol X$的这些新位置记为$\boldsymbol X_1,\boldsymbol X_2,$等等。在零时刻,$\boldsymbol X$的位置为$\boldsymbol X_0$。在零时刻前一个单位时刻,$\boldsymbol X$的位置为$\boldsymbol X_{-1}$,一般地,$\boldsymbol X$的“轨线”由$\boldsymbol X_t$给出。如果只是在整数时间值测量位置$\boldsymbol X_t$,我们就得到一个离散动力系统的例子,我们将在第15章研究离散动力系统。如果在连续时间$t \in \mathbb R$测量位置$\boldsymbol X_t$,我们就得到一个连续动力系统。如果系统以一种连续可微的方式依赖于时间,我们就得到一个光滑动力系统。这是在微分方程系统研究中产生的三种主要类型的动力系统。
将$t$带到$\boldsymbol X_t$的函数要么是得到$\mathbb R^n$中的一列点,要么是得到$\mathbb R^n$中的一条曲线,无论哪种情形,它都记录了当时间从$-\infty$跑到$\infty$时,$\boldsymbol X$的生活历史。动力系统的不同分支需要对$\boldsymbol X_t$怎样依赖于$t$作不同的假设。例如,遍历理论需要假设这样的函数保持$\mathbb R^n$上的一个测度不变;拓扑动力系统则只需假设$\boldsymbol X_t$是连续变化的。在微分方程情形,我们通常假设$\boldsymbol X_t$是连续可微的(这三种分支的特点和研究重点是什么呢?)。对每个时刻$t$,我们都可以定义映射$\phi_t:\mathbb R^n \to \mathbb R^n$,它将$\boldsymbol X$映到$\boldsymbol X_t$(就像Markov链一样,从某一时刻,转移到另一时刻)。由于我们可将$\boldsymbol X_t$理解成随时间变化的一个状态,期望$\phi_t$是以$\phi_{-t}$为逆就是很自然的事(相当于一条路,能从点$a$走到点$b$,自然,沿同一条路,可以从$b$走到点$a$)。同样地,$\phi_0$必定就是恒等函数$\phi_0(\boldsymbol X) = \boldsymbol X$,而$\phi_t(\phi_s(\boldsymbol X)) = \phi_{t+x}(\boldsymbol X)$也是一个自然的条件。我们将所有的这些都正式地陈述在下面的定义中。
定义 $\mathbb R^n$上的一个光滑动力系统是指这样的一个连续可微函数$\phi:\mathbb R \times \mathbb R^n \to \mathbb R^n$,其中$\phi(t,\boldsymbol X) = \phi_t(\boldsymbol X)$满足下面的两条:
(1)$\phi_0:\mathbb R^n \to \mathbb R^n$为恒等函数:$\phi_0(\boldsymbol X_0) = \boldsymbol X_0$;
(2)对所有的$t,s\in \mathbb R$,复合函数$\phi_t \circ \phi_s = \phi_{t+s}$。
回忆一下,一个函数是连续可微的,如果在整个定义域上,它的所有偏导数都存在并且连续。习惯上,一个连续可微函数是指一个$C^1$函数;如果函数是$k$次连续可微的,它就称为一个$C^k$函数。注意,上面的定义蕴涵着,对于每一个$t,\phi_t:\mathbb R^n \to \mathbb R^n$都是$C^1$的,而且有$C^1$的逆$\phi_{-t}$。
例 对于一阶微分方程$x' = ax$,函数$\phi_t(x_0) = x_0 \exp (at)$给出了这个方程的所有解,而且也定义了$\mathbb R$上的一个光滑动力系统。
例 令$\boldsymbol A$为一$n \times n$矩阵。则函数$\phi_t(\boldsymbol X_0) = \exp (t\boldsymbol A)\boldsymbol X_0$就定义了$\mathbb R^n$上的一个光滑动力系统。显然,$\phi_0 = \exp (0) = \boldsymbol I$,而且在上一章中已经看到:
\[\phi_{t+s} = \exp ((t+s)\boldsymbol A) = (\exp (t \boldsymbol A))(\exp (s\boldsymbol A)) = \phi_t ○ \phi_s.\]
可以看出,上面两个例子都是与微分方程系统$\boldsymbol X' = \boldsymbol {AX}$紧密相关的。一般地,从每个光滑动力系统都可以如下得到$\mathbb R^n$上的一个向量场(可以通过以上两例验证):给定$\phi_t$,令
\[\boldsymbol F(\boldsymbol X) = \frac{\text d}{\text d t}\Bigg|_{t=0} \phi_t(\boldsymbol X).\]
于是,$\phi_t$恰好就是与$\boldsymbol X' = \boldsymbol F(\boldsymbol X)$的流相应的时间$t$映射。
反过来,如果微分方程$\boldsymbol X' = \boldsymbol F(\boldsymbol X)$的流对所有的时间,其时间$t$映射都有良好的定义,而且是连续可微的,则这个微分方程就生成了一个光滑动力系统。很遗憾,事情并不总是如此。(需要什么条件呢?见前面光滑动力系统的定义!)
7.2 存在唯一性定理
我们现在转到微分方程的基本定理——存在唯一性定理。考虑微分方程系统
\[\boldsymbol X' = \boldsymbol F(\boldsymbol X).\]
其中$\boldsymbol F:\mathbb R^n \to \mathbb R^n$。此系统的一个解是指定义在某一区间$J \subset R$上的函数$\boldsymbol X:J \to \mathbb R^n$,使得对所有的$t \in J$,都有
\[\boldsymbol X'(t) = \boldsymbol F(\boldsymbol X(t)).\]
几何上,$\boldsymbol X(t)$是$\mathbb R^n$中的一条曲线,对于所有的$t \in J$,切向量$\boldsymbol X'(t)$都存在并且等于$\boldsymbol F(\boldsymbol X(t))$。像前面几章一样,我们认为这个向量的基点位于$\boldsymbol X(t)$,于是映射$\boldsymbol F:\mathbb R^n \to \mathbb R^n$就定义了$\mathbb R^n$上的一个向量场。解$\boldsymbol X:J \to \mathbb R^n$的一个初始条件或一个初值是指形如$\boldsymbol X(t_0) = \boldsymbol X_0$的一个规定,其中$t_0 \in J,\boldsymbol X_0 \in \mathbb R^n$。为了简单,我们通常取$t_0 = 0$。微分方程的一个主要问题就是寻找任一初值问题的解,即对每个$\boldsymbol X_0 \in \mathbb R^n$,确定系统的解使得它满足初始条件$\boldsymbol X(0) = \boldsymbol X_0$。
很遗憾,非线性微分方程对某些初始条件可能会没有解(会不会有无穷多个解呢?可能会!)。
例 考虑下面简单的一阶微分方程
\begin{equation}
x’=\left\{ \begin{array}{cl}
1 & \textrm{if }x<0\\
-1 & \textrm{if }x\ge0.\end{array}\right.
\end{equation}
$\mathbb R$上的这个向量场在$x \ge 0$时指向左边,而在$x <0$时指向右边。因此,没有解满足初始条件$x(0) = 0$。事实上,如果有这样的一个解,由于$x'(0) = -1$,它在初始时一定是递减的,但是,对所有取负的$x$,解又必须是递增的,这不可能发生。进一步,还可注意到,任何一个解都不可能对所有时间都有定义(对所有时间都有定义有什么特别意义呢?)。例如,当$x_0 > 0$时,过点$x_0$的解为$x(t) = x_0 -t$,但根据刚才同样的理由,这个解只在$-\infty < t < x_0$时有意义(因为若$t \ge x_0$,其导数应该为1,而不是-1)。
这个例子中的问题在于向量场在0处并不连续;只要向量场在某点出现间断,我们就可能面对相邻的向量却指向“相反”的方向,这样就使得解在这些坏点处中断。
对于非线性微分方程,除了解的存在性问题之外,我们还会碰到,某些方程对于同一个初值问题可能会有许多不同的解。
例(本例没看懂!!) 考虑微分方程
\[x' = 3x^{\frac{2}{3}}.\]
恒等于零的函数$u:\mathbb R \to \mathbb R,u(t) \equiv 0$显然是满足初始条件$u(0) = 0$的一个解,而$u_0(t) = t^3$也是满足这个初始条件的一个解(是解吗?)。进一步,对任意的$\tau > 0$,由下式给出的函数
\[u_\tau (t) = \left\{\begin{align} &0 &\text {if}&t \le \tau \\& t-\tau)^3 &\text{if}&t>\tau,\end{align}\right.\]
也是满足初始条件$u_\tau(0) = 0$的解。然而,这个例子中的微分方程在$x_0=0$处是连续的,现在的问题在于$3x^{2/3}$在这点处不可微。
从这两个例子中可以清楚地看到,为了保证解的存在唯一性,必须要对函数$\boldsymbol F$加上某些条件。在第一个例子中,$\boldsymbol F$在问题点0处不连续,而在第二个例子中,$\boldsymbol F$在0处不可微。这表明$\boldsymbol F$连续可微的假设可能就足以保证解的存在且唯一,这点我们随后就会看到。幸运的是,应用中产生的不连续可微的微分方程还是很少的,因而,对于给定的初始条件,不存在解或解不唯一的理解是相当例外的。
下面就是常微分方程的基本局部定理。
存在唯一性定理 考虑初值问题
\[\boldsymbol X' = \boldsymbol F(\boldsymbol X),\boldsymbol X(t_0) = \boldsymbol X_0,\]
其中$\boldsymbol X_0 \in \mathbb R^n$。假设$\boldsymbol F:\mathbb R^n \to \mathbb R^n$是$C^1$的,则,首先该初值问题有一个解,其次,只有一个这样的解。更准确地说,存在$a>0$,以及该微分方程满足初始条件$\boldsymbol X(t_0) = \boldsymbol X_0$的唯一解
\[\boldsymbol X:(t_0-a,t_0+a) \to \mathbb R^n.\]
该定理的重要证明见第17章。但在这里,我们可以从直观上来理解这个结论,如果向量场$\boldsymbol F$是$C^1$的,则意味着它比较光滑,而不会有急拐弯的点,这说明按照它的指示,我们在短时间内可以较好地预测未来的线路,而且由于$C^1$的限制,使得在极短的时间内,发展趋势是唯一的。
因而我们总可以假设唯一解定义在一个最大的时间区间上。然而这并不能保证$\boldsymbol X(t)$对所有时刻都有定义,不管$\boldsymbol F(\boldsymbol X)$是多么“好”。
例 考虑$\mathbb R$上的微分方程
\[x'=1+x^2.\]
这个方程以函数$x(t)=\tan (t+c)$作为它的解,其中$c$为一常数。由于当$t \to -c \pm \pi/2$时,$x(t) \to \pm \infty$,这个函数不能延拓到区间
\[-c-\frac{\pi}{2}<t<-c+\frac{\pi}{2}\]
之外。
这个例子很有代表性,因为我们有
定理 假设$U \subset \mathbb R^n$为一开集(看作状态空间的范围),并假设$\boldsymbol F:U \to \mathbb R^n$(看作一种映射关系,或状态转移函数)是$C^1$的。令$\boldsymbol X' = \boldsymbol F(\boldsymbol X)$的一个定义在最大开区间$J = (\alpha,\beta) \subset \mathbb R$上的解,其中$\beta < \infty$。则对任意的有界闭集$K \subset U$(可以这么理解:只有闭集,才有“固定”的边界,才能确定可以超越),总存在某个$t \in (\alpha,\beta)$使得$\boldsymbol X(t) \notin K$。
这个定理断言,如果解$\boldsymbol X(t)$不能延拓到一个更大的时间区间,则这个解就会离开$U$中的任何有界闭集。这意味着,当$t \to \beta$时,$\boldsymbol X(t)$可以任意接近$U$的边界。同样的结果在$t \to \alpha$时也成立。(理解为:解无法横向发展,只能竖着增长!)
7.3 解的连续依赖性
为了使得解的存在唯一性定理在各种物理(甚至是数学)意义下都有意义,还需要加上解$\boldsymbol X(t)$对初始条件$\boldsymbol X(0($的连续依赖性质。下面的定理给出了这个性质的准确陈述。
定理 考虑微分方程$\boldsymbol X' = \boldsymbol F(\boldsymbol X)$,其中$\boldsymbol F:\mathbb R^n \to \mathbb R^n$是$C^1$的。假设$\boldsymbol X(t)$是该方程的一个解,其在闭区间$[t_0,t_1]$上有定义,而且$\boldsymbol X(t_0) = \boldsymbol X_0$。则存在$\boldsymbol X_0$的领域$U \subset \mathbb R^n$以及常数$K$使得,如果$\boldsymbol Y_0 \in U$,则存在定义在$[t_0,t_1]$上唯一的解$\boldsymbol Y(t)$满足$\boldsymbol Y(t_0) = \boldsymbol Y_0$。而且,对所有的$t \in [t_0,t_1],\boldsymbol Y(t)$满足
\[|\boldsymbol Y(t) - \boldsymbol X(t)| \le K|\boldsymbol Y_0 - \boldsymbol X_0|\exp (K(t - t_0)).\]
这个结果表明,如果两个解$\boldsymbol X(t)$和$\boldsymbol Y(t)$出发时很接近,则在$t$靠近$t_0$时,它们一直很接近。虽然这两个解可能分开,但它们分开(但绝对不会交叉!)的速度不会超过指数增长速度。特别地,由于上面不等式的右端依赖于$\boldsymbol Y_0 - \boldsymbol X_0$,当假设它很小时,我人就得到:
推论 (对初始条件的连续依赖性) 记$\phi(t,\boldsymbol X)$为系统$\boldsymbol X' = \boldsymbol F(\boldsymbol X)$的流,其中$\boldsymbol F$为$C^1$的。则$\phi$为$\boldsymbol X$的连续函数。
例 令$k > 0$,我们知道系统
\[\boldsymbol X' = \begin{pmatrix} -1 & 0\\0&k\end{pmatrix}\boldsymbol X\]
满足$\boldsymbol X(0) = (-1,0)$的解为
\[\boldsymbol X(t) = (-e^{-t},0).\]
对任一$\eta \ne 0$,记$\boldsymbol Y_\eta(t)$为满足$\boldsymbol Y_\eta(0) = (-1,\eta)$的解。则
\[\boldsymbol Y_\eta(t) = (-e^{-t},\eta e^{kt}).\]
根据上面的定理,我们有
\[\left| {{\boldsymbol Y_\eta }(t) - \boldsymbol X(t)} \right| = \left| {\eta {e^{kt}} - 0} \right| = \left| {\eta - 0} \right|{e^{kt}} = \left| {{\boldsymbol Y_\eta }(0) - \boldsymbol X(0)} \right|{e^{\kappa t}}.\]
这些解$\boldsymbol Y_\eta$的确会与$\boldsymbol X(t)$分开(见图7.1),但它们至多以指数速度分开。而且,对于任何固定的时间$t$,当$\eta \to 0$时,$\boldsymbol Y_\eta (t) \to \boldsymbol X(t).$
微分方程常常依赖于参数。例如,调和振子方程依赖于参数$b$(阻尼系数)和$k$(弹性系数)。那么,一个自然的问题就是:这些方程的解如何依赖于这些参数呢?在前面的情形,只要系统是以连续可微的方式依赖于这些参数,则解就连续地依赖于这些参数。
定理 (参数的连续依赖性)令$\boldsymbol X'=\boldsymbol F_a(\boldsymbol X)$为一个微分方程系统,其中$\boldsymbol F_a$对$\boldsymbol X$和$a$都连续可微。则这个系统的流也连续依赖于$a$。
7.4 变分方程
考虑自治系统$\boldsymbol X'=\boldsymbol F_a(\boldsymbol X)$,其中$\boldsymbol F$像通常一样假设为$C^1$的。该系统的流$\phi(t,\boldsymbol X)$同时为$t$和$\boldsymbol F$的函数。由上节的结果可知,$\phi$对变量$\boldsymbol X$连续(即对初值连续依赖)。由于$t \to \phi(t,\boldsymbol X)$就是过$\boldsymbol X$的解曲线,我们还知道$\phi$对变量$t$可微。事实上,$\phi$对变量$\boldsymbol X$也是可微的(我们将在第17章给出其证明):
定理 (流的可微性) 考虑系统$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$,其中$\boldsymbol F$为$C^1$的。则系统的流$\phi(t,\boldsymbol X)$为一$C^1$函数,即$\partial \phi / \partial t$和$\partial \phi / \partial \boldsymbol X$都存在,且对$t$和$\boldsymbol X$连续(即偏导数是连续的)。
注意,一旦知道了过$\boldsymbol X_0$的解,则对任何$t$,我们总能够算出$\partial \phi / \partial t$,事实上,我们有
\[\frac{{\partial \phi }}{{\partial t}}(t,{\boldsymbol X_0}) =\boldsymbol F(\phi (t,{\boldsymbol X_0})).\]
另外,我们还有
\[\frac{{\partial \phi }}{{\partial \boldsymbol X}}(t,{\boldsymbol X_0}) =\boldsymbol D_{\phi_t}(\boldsymbol X_0),\]
其中$\boldsymbol D_{\phi_t}$为函数$\boldsymbol X \to \phi_t(\boldsymbol X)$的雅可比。然而,为了计算$\partial \phi / \partial \boldsymbol X$,除了要知道过$\boldsymbol X_0$的解,因为需要计算$\phi_t$的各个分量的偏导数,我们似乎还要知道所有经过附近初始位置的解(导数的定义是基于因变量与自变量变化之比,因此要求在所求点的领域内保证函数有确定的值,对应到这里,应该就是要求知道经过附近初始位置的解)。但是,通过引入沿过$\boldsymbol X_0$的解的变分方程,我们可以克服这个困难。
为了实现这一点,需要先对非自治微分方程作简短讨论。令$\boldsymbol A(t)$为一族连续依赖于$t$的$n \times n$矩阵。系统
\[\boldsymbol X' = \boldsymbol A(t) \boldsymbol X\]
为一个线性非自治系统。对这种类型的方程,有如下的存在唯一性定理:
定理 令$\boldsymbol A(t)$为定义在$t \in [\alpha,\beta]$上的$n \times n$矩阵的一个连续族。则初值问题
\[\boldsymbol X' = \boldsymbol A(t) \boldsymbol X, \;\; \boldsymbol X(t_0) = \boldsymbol X_0\]
具有唯一解,而且解在整个区间$[\alpha,\beta]$上都有定义。
注意,这个定理有一些新的东西:并不需要假设右端是$t$的$C^1$函数。$\boldsymbol A(t)$的连续性就足以保证解的存在唯一性。另外,线性非自治微分方程的解满足线性叠加原理,即如果$\boldsymbol Y(t),\boldsymbol Z(t)$是这样一个系统的两个解,则对任意的常数$\alpha,\beta,\alpha\boldsymbol Y(t) + \beta \boldsymbol Z(t)$也是它的解。
现在,我们再回到自治非线性系统$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$。令$\boldsymbol X(t)$为该系统的一个特解,假设在某个区间$J = [\alpha,\beta]$上对$t$有定义。固定$t_0 \in J$,记$\boldsymbol X(t_0) = \boldsymbol X_0$。对每个$t \in J$,令
\[\boldsymbol A(t) = \boldsymbol {DF}_{\boldsymbol X(t)},\]
其中$\boldsymbol {DF}_{\boldsymbol X(t)}$代表$\boldsymbol F$在点$\boldsymbol X(t) \in \mathbb R^n$处的雅可比矩阵(这一思路其实就是非线性系统线性化的过程)。由于$\boldsymbol F$为$C^1$的,$\boldsymbol A(t) = \boldsymbol {DF}_{\boldsymbol X(t)}$是一族连续的$n \times n$矩阵。考虑非自治线性方程
\[\boldsymbol U' = \boldsymbol A(t)\boldsymbol U.\]
该方程称为沿解$\boldsymbol X(t)$的变分方程。由上一个定理可知,对所有的初始条件$\boldsymbol U(t_0) = \boldsymbol U_0$,该变分方程都有一个定义在整个$J$上的解。
这个方程的意义在于:如果$\boldsymbol U(t)$为变分方程满足$\boldsymbol U(t_0) = \boldsymbol U_0$的解,则只要$\boldsymbol U_0$充分小,函数
\[t \to \boldsymbol X(t) + \boldsymbol U(t)\]
就是原来自治方程满足初始条件$\boldsymbol Y(t_0) = \boldsymbol X_0 + \boldsymbol U_0$的解$\boldsymbol Y(t)$的一个好的逼近。这就是下面结果的内容。
命题 考虑系统$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$,其中$\boldsymbol F$为$C^1$的。假设
(1)$\boldsymbol X(t)$为$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$的一个解,对所有的$t \in [\alpha,\beta]$都有定义,且$\boldsymbol X(t_0) = \boldsymbol X_0$;
(2)$\boldsymbol U(t)$为沿$\boldsymbol X(t)$的变分方程的解,且$\boldsymbol U(t_0) = \boldsymbol U_0$;
(3)$\boldsymbol Y(t)$为$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$的解,且$\boldsymbol Y(t_0) = \boldsymbol X_0 + \boldsymbol U_0$。
则
\[\mathop {\lim }\limits_{{\boldsymbol U_0} \to 0} \frac{{\left| {\boldsymbol Y(t) - (\boldsymbol x(t) +\boldsymbol U(t))} \right|}}{{\left| {{\boldsymbol U_0}} \right|}}\]
对于$t \in [\alpha,\beta]$一致收敛到0。
严格来说就是,对任意的$\epsilon > 0$,存在$\delta > 0$使得当$|\boldsymbol U_0| \le \delta$时,对据有的$t \in [\alpha,\beta]$都有
\[|\boldsymbol Y(t) - (\boldsymbol X(t) + \boldsymbol U(t)))| \le \epsilon |U_0.|\]
从而,当$\boldsymbol U_0 \to 0$时,曲线$t \to \boldsymbol X(t) + \boldsymbol U(t)$将越来越逼近$\boldsymbol Y(t)$。在许多应用中,人们直接用从变分方程得到的解$\boldsymbol X(t) + \boldsymbol U(t)$来代替原来的解$\boldsymbol Y(t)$;由线性叠加原理,$\boldsymbol U(t)$线性地依赖于$\boldsymbol U_0$,这将会带来很大的方便。
任给非线性微分方程系统$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$,如果$\boldsymbol X_0$为它的一个平衡点,则我们就可以考虑沿这个解的变分方程。但此时,$\boldsymbol {DF_X}_0$是一个常值矩阵$\boldsymbol A$,从而变分变分方程$\boldsymbol U' = \boldsymbol {AU}$为一个自治的线性系统。这个系统称为在$\boldsymbol X_0$处的线性化系统。我们知道线性化系统的流为$\exp (t\boldsymbol A)\boldsymbol U_0$,于是,上面的命题就表明,在平衡点附近,一个非线性系统的相图与它的线性化系统的相图是相似的。在下一章,我们要将“相似”这一说法更准确化。
利用上一命题,假设知道了解$\boldsymbol X(t)$,现在就可以如下来计算$\partial \phi /\partial \boldsymbol X$:
定理 设$\boldsymbol X'=\boldsymbol F(\boldsymbol X)$为一个微分方程系统,其中$\boldsymbol F$为$C^1$的。令$\boldsymbol X(t)$为该系统满足初始条件$\boldsymbol X(0) = \boldsymbol X_0$的解,它在$t \in [\alpha,\beta]$上有定义;再令$\boldsymbol (t,\boldsymbol U_0)$为沿$\boldsymbol X(t)$的变分方程满足$\boldsymbol U(0,\boldsymbol U_0$的解。则
\[\boldsymbol D_{\phi_t}(\boldsymbol X_0)\boldsymbol U_0 = \boldsymbol U(t,\boldsymbol U_0),\]
即$\partial \phi /\partial \boldsymbol X$在$\boldsymbol U_0$上的作用可由从$\boldsymbol U_0$出发求解相应的变分方程给出(为什么要求解上式呢?)。
证明 根据上一命题,对所有的$t \in [\alpha,\beta]$,我们有
\[{\boldsymbol D_{{\phi _t}}}({\boldsymbol X_0}){\boldsymbol U_0} = \mathop {\lim }\limits_{h \to \infty } \frac{{{\phi _t}({\boldsymbol X_0} + h{\boldsymbol U_0}) - {\phi _t}({\boldsymbol X_0})}}{h} = \mathop {\lim }\limits_{h \to \infty } \frac{{\boldsymbol U(t,h{\boldsymbol U_0})}}{h} =\boldsymbol U(t,{\boldsymbol U_0}).\]
[此证明还不是很理解!]
例 作为这些想法的一个说明,我们来考虑微分方程$\boldsymbol x' = x^2$。简单的积分表明,满足初始条件$x(0) = x_0$的解为
\[x(t) = \frac{-x_0}{x_0t -1}.\]
于是,我们有
\[\frac {\partial \phi}{\partial x}(t,x_0) = \frac{1}{(x_0t-1)^2}.\]
[上式对应于$\boldsymbol D_{\phi_t}(\boldsymbol X_0)$]另一方面,沿$x(t)$的变分方程为
\[u' = 2x(t)u = \frac{{ - 2{x_0}}}{{{x_0}t - 1}}u.\]
该方程满足初始条件$u(0) = u_0$的解为
\[u(t) = {u_0}{\left( {\frac{1}{{{x_0}t - 1}}} \right)^2},\]
[上式对应于$\boldsymbol U(t,\boldsymbol U_0)$]这正与我们期望的一样。
本定理的作用是显然的:直接求解$\frac {\partial \phi}{\partial x}(t,x_0)$有困难,可以通过求解变分方程的解$\boldsymbol U(t,\boldsymbol U_0)$,而前者作用于$\boldsymbol U_0$的结果就是后者。