寻找“最好”（2）——欧拉-拉格朗日方程

　　欧拉-拉格朗日方程(Euler -Lagrange equation) 为变分法中的一条重要方程。它提供了求泛函的平稳值的一个方法，其最初的想法是初等微积分理论中的“可导的极值点一定是稳定点（临界点）”。当能量泛函包含微分时，用变分方法推导其证明过程，简单地说，假设当前的函数（即真实解）已知，那么这个解必然使能量泛函取全局最小值。

泛函

　　我们很清楚函数的概念，它大致是，将一个自变量扔到一个黑盒里，经过黑盒的暗箱操作，最终得到了一个因变量：

　　泛函数是将一个函数作为自变量，经过黑盒，最终得到一个实数的因变量：

　　可以说，泛函就是函数的函数，是更广泛意义上的函数。

欧拉-拉格朗日方程

最速降线

　　有一种泛函称为简单泛函，它的长相是这样：

　　其中L是一个确定的函数，之所以叫简单泛函，是因为只传递了三个参数，复杂一点的话还可以继续传递f的高阶导数。现在的问题是，如果A处于极值点，它对应的f(x)是什么？

　　这实际上是求一个具体函数，使得泛函能够取得极值。一个典型的例子是最速降线问题：从所有连接不在同一铅垂线上的定点A、B的曲线中找出一条曲线，使得初始速度为0的质点，受重力作用，由A沿着曲线滑下时以最短的时间到达B：

　　这里我们将曲线看作路径f关于时间t的函数：

　　ΔS_i是在极短时间Δt_i内沿着曲线移动的微小弧长，此时的瞬时速度是ΔV_i，距离=速度×时间：

　　重力加速的推论，在t时间处的速度v²= 2gh：

　　质点从A点到B点的总时间：

　　根据弧长公式，可以将dS化简，进一步写成（关于弧长公式，可参考：《数学笔记25——弧长和曲面面积》）：

　　把结论和简单泛函做个对比，可以看到二者形式相吻合：

　　最右侧的式子并没有严格映射到L(x,f(x),f’(x))，因为在函数中并没有直接使用到参数t，这无所谓了，可以理解成虽然传递了参数t，但实际上t并没有起任何作用，就像y (x) = 1一样，无论传递任何x，最终结果都是1，但它仍然是一个y关于x的函数。现在回到最初的问题，AB间有无数条曲线，每条曲线都可以求得时间T[f]，在众多的曲线中，有一条唯一的曲线能够使得T[f]取得最小值，这个f(x)应该长成什么样？

EL方程的推导

　　这里暂且耍一下流氓，抛开具体的速降问题，只看A[f]，并且假设f₀(x)就是符合条件的最优函数。现在，将f₀(x) + k(x)定义为是有别于最优曲线f₀(x)的其它函数，其中k(x)可以是任意函数。如果如下定义f(x, k)：

　　因为f₀(x)是最优函数，此时A[f₀]有最小值，则一定有：

　　由于任意函数k(x)不好定义，为了能够使k(x)任意小，令：

　　η是任意函数，当ε取极小值时，可以看作是对f₀(x)的轻微扰动；还需要额外定义的是，在端点处是不能扰动的，即εη(A) = εη(B) = 0，这对于任意ε都适用，所以η(A) = η(B) = 0。注意ε是对f₀(x)的扰动程度，εη(x)是扰动后的增量，εη(x) = 0说明扰动为0，也就是无扰动，f(x) + εη(x)才是扰动后的函数。

　　由于假设f₀(x)是最优函数，所以可以将f₀(x)看作已经确定的函数，如果再将任意函数η(x)看作一个确定的函数，那么A可以看成ε的函数，若A’ = 0，函数存在极值，这已经变成了极值点的求解：

　　根据链式法则（可参考《多变量微积分笔记4——全微分与链式法则》）：

　　根据分部积分（可参考《单变量微积分笔记24——分部积分》）：

　　η(x) = 0说明对f₀(x)无扰动时，A能取得极值，但它对f₀的具体形式无任何帮助；因此最优函数f₀(x)的具体形式由第一个解确定：

　　这就是欧拉-拉格朗日方程（Euler-Lagrage equation），可以帮助我们求解泛函下的极值，这里L是已知的。它的最初的思想来源于微积分中“可导的极值点一定是稳定点（临界点）”。它的思想在于：假定当前泛函的解已知，那么这个解必然使得泛函取得最小值（假定是最小值）。换言之，只要在泛函中加入任何扰动，都会使泛函的值变大，所以扰动为0的时候，就是泛函关于扰动的一个极小值。扰动用一个很小的数ε乘上一个连续函数η(x)。当ε趋近于0，意味着扰动也趋近于0。所以当扰动为0时，泛函对扰动程度的导数也为0。这就非常巧妙的把对函数求导的问题转化成了一个单变量求导问题。

　需要注意的是，欧拉-拉格朗日方程的前提条件是端点不会扰动，也就是说需要固定两个端点。