拉格朗日插值法

技术背景

2024年诺贝尔物理学奖和化学奖的揭幕，正式宣告了科学界对AI时代的认可，人工智能正在全方位的改变人类社会各种场景的互作模式，而数据拟合以及误差与算力的控制，则是大多数人工智能工作者所关注的重点。与数据拟合的思想不同的是，传统的数值计算中人们更倾向于使用多项式进行精确的参数计算，这种方法叫做插值。当然，插值算法的精确是相对于边界条件而言的，随着点数的变化，不同的插值算法有不同的余项。现在在模型训练中，因为数据点本身就是有误差的，所以强行使用插值算法会导致过拟合的现象。只有在一些传统的对精度要求较高的计算场景中，保留了插值算法的应用。

线性插值

给定两个点： $(x_1,y_1),(x_2,y_2)$ ，其插值出来的线性函数为：

f (x) = \frac{y_{2} - y_{1}}{x_{2} - x_{1}} x + y_{1} - \frac{y_{2} - y_{1}}{x_{2} - x_{1}} x_{1} = \frac{y_{2} - y_{1}}{x_{2} - x_{1}} x + y_{2} - \frac{y_{2} - y_{1}}{x_{2} - x_{1}} x_{2}

$f(x)=\frac{y_2-y_1}{x_2-x_1}x+y_1-\frac{y_2-y_1}{x_2-x_1}x_1=\frac{y_2-y_1}{x_2-x_1}x+y_2-\frac{y_2-y_1}{x_2-x_1}x_2$

稍微改写一下形式有：

f (x) = (\frac{x_{2} - x}{x_{2} - x_{1}}) y_{1} + (\frac{x - x_{1}}{x_{2} - x_{1}}) y_{2}

$f(x)=\left(\frac{x_2-x}{x_2-x_1}\right)y_1+\left(\frac{x-x_1}{x_2-x_1}\right)y_2$

可以得到 $f(x_1)=y_1,f(x_2)=y_2$ 。

二次插值

给定三个点： $(x_1,y_1),(x_2,y_2),(x_3,y_3)$ ，假设其插值函数为： $f(x)=ax^2+bx+c$ ，那么可以根据三个点联立方程组，写成矩阵形式就是：

(\begin{matrix} x_{1}^{2} & x_{1} & 1 \\ x_{2}^{2} & x_{2} & 1 \\ x_{3}^{2} & x_{3} & 1 \end{matrix}) (\begin{matrix} a \\ b \\ c \end{matrix}) = (\begin{matrix} y_{1} \\ y_{2} \\ y_{3} \end{matrix})

$\left( \begin{matrix} x_1^2&&x_1&&1\\ x_2^2&&x_2&&1\\ x_3^2&&x_3&&1 \end{matrix} \right)\left( \begin{matrix} a\\b\\c \end{matrix} \right)=\left( \begin{matrix} y_1\\y_2\\y_3 \end{matrix} \right)$

所以求解系数 $a,b,c$ 变成了一个矩阵求逆问题，可以手动做一个初等变换：

\begin{aligned} (\begin{matrix} x_{1}^{2} & x_{1} & 1 & 1 & 0 & 0 \\ x_{2}^{2} & x_{2} & 1 & 0 & 1 & 0 \\ x_{3}^{2} & x_{3} & 1 & 0 & 0 & 1 \end{matrix}) & \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 1 & \frac{1}{x_{2}} & \frac{1}{x_{2}^{2}} & 0 & \frac{1}{x_{2}^{2}} & 0 \\ 1 & \frac{1}{x_{3}} & \frac{1}{x_{3}^{2}} & 0 & 0 & \frac{1}{x_{3}^{2}} \end{matrix}) \\ \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 0 & \frac{x_{1} - x_{2}}{x_{1} x_{2}} & \frac{x_{1}^{2} - x_{2}^{2}}{x_{1}^{2} x_{2}^{2}} & - \frac{1}{x_{1}^{2}} & \frac{1}{x_{2}^{2}} & 0 \\ 0 & \frac{x_{1} - x_{3}}{x_{1} x_{3}} & \frac{x_{1}^{2} - x_{3}^{2}}{x_{1}^{2} x_{3}^{2}} & - \frac{1}{x_{1}^{2}} & 0 & \frac{1}{x_{3}^{2}} \end{matrix}) \\ \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 0 & \frac{x_{1} - x_{2}}{x_{1} x_{2}} & \frac{x_{1}^{2} - x_{2}^{2}}{x_{1}^{2} x_{2}^{2}} & - \frac{1}{x_{1}^{2}} & \frac{1}{x_{2}^{2}} & 0 \\ 0 & \frac{x_{1} - x_{2}}{x_{1} x_{2}} & \frac{(x_{1} + x_{3}) (x_{1} - x_{2})}{x_{1}^{2} x_{2} x_{3}} & - \frac{x_{3} (x_{1} - x_{2})}{x_{1}^{2} x_{2} (x_{1} - x_{3})} & 0 & \frac{x_{1} - x_{2}}{x_{2} x_{3} (x_{1} - x_{3})} \end{matrix}) \\ \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 0 & \frac{x_{1} - x_{2}}{x_{1} x_{2}} & \frac{x_{1}^{2} - x_{2}^{2}}{x_{1}^{2} x_{2}^{2}} & - \frac{1}{x_{1}^{2}} & \frac{1}{x_{2}^{2}} & 0 \\ 0 & 0 & \frac{(x_{1} - x_{2}) (x_{2} - x_{3})}{x_{1} x_{2}^{2} x_{3}} & \frac{x_{2} - x_{3}}{x_{1} x_{2} (x_{1} - x_{3})} & - \frac{1}{x_{2}^{2}} & \frac{x_{1} - x_{2}}{x_{2} x_{3} (x_{1} - x_{3})} \end{matrix}) \\ \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 0 & 1 & \frac{x_{1} + x_{2}}{x_{1} x_{2}} & - \frac{x_{2}}{x_{1} (x_{1} - x_{2})} & \frac{x_{1}}{x_{2} (x_{1} - x_{2})} & 0 \\ 0 & 0 & 1 & \frac{x_{2} x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & - \frac{x_{1} x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{x_{1} x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \end{matrix}) \\ \to (\begin{matrix} 1 & \frac{1}{x_{1}} & \frac{1}{x_{1}^{2}} & \frac{1}{x_{1}^{2}} & 0 & 0 \\ 0 & 1 & 0 & - \frac{x_{2} + x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{x_{1} + x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & - \frac{x_{1} + x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ 0 & 0 & 1 & \frac{x_{2} x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & - \frac{x_{1} x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{x_{1} x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \end{matrix}) \\ \to (\begin{matrix} 1 & 0 & 0 & \frac{1}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{- 1}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{1}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ 0 & 1 & 0 & - \frac{x_{2} + x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{x_{1} + x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & - \frac{x_{1} + x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ 0 & 0 & 1 & \frac{x_{2} x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & - \frac{x_{1} x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{x_{1} x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \end{matrix}) \end{aligned}

$\begin{align*} \left( \begin{matrix} x_1^2&&x_1&&1&&1&&0&&0\\ x_2^2&&x_2&&1&&0&&1&&0\\ x_3^2&&x_3&&1&&0&&0&&1 \end{matrix} \right)&\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 1&&\frac{1}{x_2}&&\frac{1}{x_2^2}&&0&&\frac{1}{x_2^2}&&0\\ 1&&\frac{1}{x_3}&&\frac{1}{x_3^2}&&0&&0&&\frac{1}{x_3^2} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 0&&\frac{x_1-x_2}{x_1x_2}&&\frac{x_1^2-x_2^2}{x_1^2x_2^2}&&-\frac{1}{x_1^2}&&\frac{1}{x_2^2}&&0\\ 0&&\frac{x_1-x_3}{x_1x_3}&&\frac{x_1^2-x_3^2}{x_1^2x_3^2}&&-\frac{1}{x_1^2}&&0&&\frac{1}{x_3^2} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 0&&\frac{x_1-x_2}{x_1x_2}&&\frac{x_1^2-x_2^2}{x_1^2x_2^2}&&-\frac{1}{x_1^2}&&\frac{1}{x_2^2}&&0\\ 0&&\frac{x_1-x_2}{x_1x_2}&&\frac{(x_1+x_3)(x_1-x_2)}{x_1^2x_2x_3}&&-\frac{x_3(x_1-x_2)}{x_1^2x_2(x_1-x_3)}&&0&&\frac{x_1-x_2}{x_2x_3(x_1-x_3)} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 0&&\frac{x_1-x_2}{x_1x_2}&&\frac{x_1^2-x_2^2}{x_1^2x_2^2}&&-\frac{1}{x_1^2}&&\frac{1}{x_2^2}&&0\\ 0&&0&&\frac{(x_1-x_2)(x_2-x_3)}{x_1x_2^2x_3}&&\frac{x_2-x_3}{x_1x_2(x_1-x_3)}&&-\frac{1}{x_2^2}&&\frac{x_1-x_2}{x_2x_3(x_1-x_3)} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 0&&1&&\frac{x_1+x_2}{x_1x_2}&&-\frac{x_2}{x_1(x_1-x_2)}&&\frac{x_1}{x_2(x_1-x_2)}&&0\\ 0&&0&&1&&\frac{x_2x_3}{(x_1-x_2)(x_1-x_3)}&&-\frac{x_1x_3}{(x_1-x_2)(x_2-x_3)}&&\frac{x_1x_2}{(x_1-x_3)(x_2-x_3)} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&\frac{1}{x_1}&&\frac{1}{x_1^2}&&\frac{1}{x_1^2}&&0&&0\\ 0&&1&&0&&-\frac{x_2+x_3}{(x_1-x_2)(x_1-x_3)}&&\frac{x_1+x_3}{(x_1-x_2)(x_2-x_3)}&&-\frac{x_1+x_2}{(x_1-x_3)(x_2-x_3)}\\ 0&&0&&1&&\frac{x_2x_3}{(x_1-x_2)(x_1-x_3)}&&-\frac{x_1x_3}{(x_1-x_2)(x_2-x_3)}&&\frac{x_1x_2}{(x_1-x_3)(x_2-x_3)} \end{matrix} \right)\\ &\rightarrow \left( \begin{matrix} 1&&0&&0&&\frac{1}{(x_1-x_2)(x_1-x_3)}&&\frac{-1}{(x_1-x_2)(x_2-x_3)}&&\frac{1}{(x_1-x_3)(x_2-x_3)}\\ 0&&1&&0&&-\frac{x_2+x_3}{(x_1-x_2)(x_1-x_3)}&&\frac{x_1+x_3}{(x_1-x_2)(x_2-x_3)}&&-\frac{x_1+x_2}{(x_1-x_3)(x_2-x_3)}\\ 0&&0&&1&&\frac{x_2x_3}{(x_1-x_2)(x_1-x_3)}&&-\frac{x_1x_3}{(x_1-x_2)(x_2-x_3)}&&\frac{x_1x_2}{(x_1-x_3)(x_2-x_3)} \end{matrix} \right) \end{align*}$

也就是说，最终的逆矩阵为：

(\begin{matrix} \frac{1}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{- 1}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{1}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ - \frac{x_{2} + x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{x_{1} + x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & - \frac{x_{1} + x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ \frac{x_{2} x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & - \frac{x_{1} x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{x_{1} x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \end{matrix})

$\left( \begin{matrix} \frac{1}{(x_1-x_2)(x_1-x_3)}&&\frac{-1}{(x_1-x_2)(x_2-x_3)}&&\frac{1}{(x_1-x_3)(x_2-x_3)}\\ -\frac{x_2+x_3}{(x_1-x_2)(x_1-x_3)}&&\frac{x_1+x_3}{(x_1-x_2)(x_2-x_3)}&&-\frac{x_1+x_2}{(x_1-x_3)(x_2-x_3)}\\ \frac{x_2x_3}{(x_1-x_2)(x_1-x_3)}&&-\frac{x_1x_3}{(x_1-x_2)(x_2-x_3)}&&\frac{x_1x_2}{(x_1-x_3)(x_2-x_3)} \end{matrix} \right)$

可以验证：

(\begin{matrix} x_{1}^{2} & x_{1} & 1 \\ x_{2}^{2} & x_{2} & 1 \\ x_{3}^{2} & x_{3} & 1 \end{matrix}) (\begin{matrix} \frac{1}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{- 1}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{1}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ - \frac{x_{2} + x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & \frac{x_{1} + x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & - \frac{x_{1} + x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \\ \frac{x_{2} x_{3}}{(x_{1} - x_{2}) (x_{1} - x_{3})} & - \frac{x_{1} x_{3}}{(x_{1} - x_{2}) (x_{2} - x_{3})} & \frac{x_{1} x_{2}}{(x_{1} - x_{3}) (x_{2} - x_{3})} \end{matrix}) = (\begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix})

$\left( \begin{matrix} x_1^2&&x_1&&1\\ x_2^2&&x_2&&1\\ x_3^2&&x_3&&1 \end{matrix} \right) \left( \begin{matrix} \frac{1}{(x_1-x_2)(x_1-x_3)}&&\frac{-1}{(x_1-x_2)(x_2-x_3)}&&\frac{1}{(x_1-x_3)(x_2-x_3)}\\ -\frac{x_2+x_3}{(x_1-x_2)(x_1-x_3)}&&\frac{x_1+x_3}{(x_1-x_2)(x_2-x_3)}&&-\frac{x_1+x_2}{(x_1-x_3)(x_2-x_3)}\\ \frac{x_2x_3}{(x_1-x_2)(x_1-x_3)}&&-\frac{x_1x_3}{(x_1-x_2)(x_2-x_3)}&&\frac{x_1x_2}{(x_1-x_3)(x_2-x_3)} \end{matrix} \right) = \left( \begin{matrix} 1&&0&&0\\ 0&&1&&0\\ 0&&0&&1 \end{matrix} \right)$

有了逆矩阵，就可以计算参数数值 $a,b,c$ ，那么这里我们直接写出函数形式：

f (x) = \frac{(x - x_{2}) (x - x_{3})}{(x_{1} - x_{2}) (x_{1} - x_{3})} y_{1} + \frac{(x - x_{1}) (x - x_{3})}{(x_{2} - x_{1}) (x_{2} - x_{3})} y_{2} + \frac{(x - x_{1}) (x - x_{2})}{(x_{3} - x_{1}) (x_{3} - x_{2})} y_{3}

$f(x)=\frac{(x-x_2)(x-x_3)}{(x_1-x_2)(x_1-x_3)}y_1+\frac{(x-x_1)(x-x_3)}{(x_2-x_1)(x_2-x_3)}y_2+\frac{(x-x_1)(x-x_2)}{(x_3-x_1)(x_3-x_2)}y_3$

拉格朗日插值法

观察前面线性插值和二次插值的函数规律，可以给出一个推广形式：

f (x) = \sum_{i = 1}^{N} c_{i} (x, x_{1}, x_{2}, . . ., x_{N}) y_{N}

$f(x)=\sum_{i=1}^{N}c_i(x,x_1,x_2,...,x_N)y_N$

其中系数函数 $c_i(x,x_1,x_2,...,x_N)=\prod_{j=1}^{i-1}\frac{x-x_j}{x_i-x_j}\prod_{k=i+1}^{N}\frac{x-x_k}{x_i-x_k}$ 。可以给出 $N$ 个数据点的 $N-1$ 次插值函数解析式，这就是拉格朗日插值法，满足 $f(x_i)=y_i$ 的约束条件。

牛顿插值法

如果把线性插值中的函数表达式再修改一下形式，变成：

f (x) = y_{1} + \frac{y_{2} - y_{1}}{x_{2} - x_{1}} (x - x_{1})

$f(x)=y_1+\frac{y_2-y_1}{x_2-x_1}(x-x_1)$

类似的，二阶插值函数可以改成如下形式：

f (x) = y_{1} + \frac{y_{2} - y_{1}}{x_{2} - x_{1}} (x - x_{1}) + \frac{\frac{y_{3} - y_{2}}{x_{3} - x_{2}} - \frac{y_{2} - y_{1}}{x_{2} - x_{1}}}{x_{3} - x_{1}} (x - x_{1}) (x - x_{2})

$f(x)=y_1+\frac{y_2-y_1}{x_2-x_1}(x-x_1)+\frac{\frac{y_3-y_2}{x_3-x_2}-\frac{y_2-y_1}{x_2-x_1}}{x_3-x_1}(x-x_1)(x-x_2)$

如果定义一个一阶差商为：

g (x_{i}, x_{i + 1}) = \frac{y_{i + 1} - y_{i}}{x_{i + 1} - x_{i}}

$g(x_i,x_{i+1})=\frac{y_{i+1}-y_i}{x_{i+1}-x_i}$

其含义为 $(x_i,x_{i+1})$ 区间内的平均变化率。有了一阶差商的定义，就可以递归的定义二阶差商：

g (x_{i}, x_{i + 1}, x_{i + 2}) = \frac{g (x_{i + 1}, x_{i + 2}) - g (x_{i}, x_{i + 1})}{x_{i + 2} - x_{i}}

$g(x_i,x_{i+1},x_{i+2})=\frac{g(x_{i+1},x_{i+2})-g(x_{i},x_{i+1})}{x_{i+2}-x_i}$

以及 $m$ 阶的差商：

g (x_{i}, x_{i + 1}, x_{i + 2}, . . ., x_{i + m}) = \frac{g (x_{i + 1}, x_{i + 2}, . . ., x_{i + m}) - g (x_{i}, x_{i + 1}, . . ., x_{i + m - 1})}{x_{i + m} - x_{i}}

$g(x_i,x_{i+1},x_{i+2},...,x_{i+m})=\frac{g(x_{i+1},x_{i+2},...,x_{i+m})-g(x_{i},x_{i+1},...,x_{i+m-1})}{x_{i+m}-x_i}$

则可以写出牛顿插值的函数形式为：

f (x) = y_{1} + \sum_{i = 1}^{N - 1} g (x_{1}, . . ., x_{i + 1}) \prod_{j = 1}^{i} (x - x_{j})

$f(x)=y_1+\sum_{i=1}^{N-1}g(x_1,...,x_{i+1})\prod_{j=1}^{i}(x-x_j)$

插值形式对比

拉格朗日插值算法和牛顿插值算法，插值的阶数是一致的，同样的点数插值出来的多项式也是唯一的，换句话说两个方法插值出来的函数其实是等价的。那么两个插值算法的优劣势在哪里？我们考虑这么一种情况，原本有 $N$ 个数据点需要插值，此时如果再引入一个新的数据点，总点数变成了 $N+1$ 。此时如果使用的是拉格朗日插值法，那么就需要我们把所有的系数全都再算一遍。而如果使用的是牛顿插值法，那么我们发现前面的 $N$ 个系数是不需要发生变化的，我们只需要再计算一个新的系数即可，极大程度上的减少了点数更新所带来的参数计算量。但也并不是说拉格朗日插值没有用武之地，在现如今的张量计算时代，拉格朗日插值法的每一项系数都是同Shape的张量操作，反而是牛顿插值的递归形式在张量计算中会有一些麻烦。