【数学】多项式插值 - 拉格朗日插值

多项式插值简介

这部分内容收录在这篇文章中:【数学】多项式插值

原理

由这 \(n + 1\) 个点,可以构造对应的 \(n + 1\) 个多项式,其中第 \(i\) 的多项式的形式为:

\[l_i(x) = \prod\limits_{j = 0, \; j \neq i}^{n} \frac{(x - x_j)} {(x_i - x_j)} \]

把下标为 \(i\) 的点 \(x_i\) 代入,可以得到:

\[\begin{eqnarray} l_i(x_i) &=& \prod\limits_{j = 0, \; j \neq i}^{n} \frac{(x_i - x_j)} {(x_i - x_j)} \nonumber \\ &=& \prod\limits_{j = 0, \; j \neq i}^{n} 1 \nonumber \\ &=& 1 \nonumber \end{eqnarray} \]

把给定的点中,下标不为 \(i\) 的某个点 \(x_{j0}\) 代入,可以得到:

\[ \begin{eqnarray} l_i(x_{j0}) &=& \prod\limits_{j = 0, \; j \neq i}^{n} \frac{(x_{j0} - x_j)} {(x_i - x_j)} \nonumber \\ &=& 0 \nonumber \end{eqnarray} \]

因为分子部分总存在 $ (x_{j0} - x_{j0}) = 0 $ 所以上式为 \(0\)

把不在给定的点中的任意点 \(x\) 代入,显然有 \(n\) 项,所以,这是一个 \(n\) 次的多项式。

于是,把上面的 \(n + 1\) 个不同的 \(l_i(x)\)\(y_i\) 相乘,再相加,即可构造下面的多项式:

\[L(x) = \sum\limits_{i = 0}^{n} y_i \cdot l_i(x) \]

由上面的推理可知, $ L(x_i) = y_i $ ,并且 \(L(x_i)\) 是一个不超过 \(n\) 次的多项式(由于最高次的系数可能会被抵消,导致次数降低)。

由唯一性定理可知,这个 \(L(x)\) 就是我们要找的 \(P(x)\) ,即

\[P(x) = L(x) \]

模板

在代码中,为了统一我所有的模板和我一直以来的习惯,也就是从1开始计数的写法以及\(n\) 表示点数,代码部分中的下标和其他文章(包括前述内容)中或许有差异。

本文中所有的代码都用 \(n\) 表示点数,他们分别为 \((x_1, y_1), (x_2, y_2), (x_3, y_3), \cdots, (x_{n}, y_{n})\),也就是多项式的最高次数不超过 \(n - 1\)。对一个不超过 \(n - 1\) 次的多项式插值,至少需要 \(n\) 个点。

对于任意点求解

直接求解

复杂度

时间复杂度 \(O(n^2)\) ,空间复杂度 \(O(1)\)

使用说明

  1. 检查数据规模MAXN,注意数据规模指的是**点数 \(n\) **(或者多项式的次数 \(n - 1\) )和模数MOD
  2. 输入点数 \(n\) ,和两个1-index的数组 \(x, y\) 表示给定的点。
  3. 无需初始化,直接调用 ll lagrange_interpolation (ll x0, ll *x, ll *y, int n),返回值即 \(L(x_0)\)

代码

namespace LagrangeInterpolation {

static const int MOD = 998244353;

ll qpow (ll x, ll n) {
    ll res = 1;
    while (n) {
        if (n & 1) {
            res = res * x % MOD;
        }
        x = x * x % MOD;
        n >>= 1;
    }
    return res;
}

ll inv (ll x) {
    return qpow (x, MOD - 2);
}

/**
 * 用 n 个点 (x[1], y[1]), (x[2], y[2]), ..., (x[n], y[n])
 * 插值得到 n - 1 次多项式 L,直接求解 L(x0) 的值
 *
 * 时间复杂度: O(n^2)
 * 空间复杂度:O(1)
*/
ll lagrange_interpolation (ll x0, ll *x, ll *y, int n) {
    for (int i = 1; i <= n; ++i) {
        if (x0 == x[i]) {
            return y[i];
        }
    }
    ll Lx0 = 0;
    ll P = 1;
    for (int i = 1; i <= n; ++i) {
        P = P * (x0 - x[i] + MOD) % MOD;
    }
    for (int i = 1; i <= n; ++i) {
        ll q = 1;
        for (int j = 1; j <= n; ++j) {
            if (j == i) {
                continue;
            }
            q = q * (x[i] - x[j] + MOD) % MOD;
        }
        ll p = P * inv (x0 - x[i] + MOD) % MOD;
        ll lix0 = p * inv (q) % MOD;
        Lx0 = (Lx0 + lix0 * y[i] % MOD) % MOD;
    }
    return Lx0;
}

};

转换成多项式的系数表达

原理

\(x \neq x_i\) 恒成立时:

\[\begin{eqnarray} l_i(x) &=& \prod\limits_{j = 0, \; j \neq i}^{n} \frac{(x - x_j)} {(x_i - x_j)} \nonumber \\ &=& \frac{\prod\limits_{j = 0, \; j \neq i}^{n} (x - x_j)} {\prod\limits_{j = 0, \; j \neq i}^{n} (x_i - x_j)} \nonumber \\ &=& \frac{\prod\limits_{j = 0}^{n} (x - x_j)} {(x - x_i) \prod\limits_{j = 0, \; j \neq i}^{n} (x_i - x_j)} \nonumber \end{eqnarray} \]

\(P = \prod\limits_{j = 0}^{n} (x - x_j)\) 这是一个和 \(i\) 无关的量,结果是一个 \(n\) 次多项式
\(C = \prod\limits_{j = 0, \; j \neq i}^{n} (x_i - x_j)\) 这是一个常数
\(Q_i = (x - x_i)\) 这是一个二项式

得到

\[l_i(x) = P \cdot \frac{1}{C_i \cdot Q_i} \]

预处理多项式 \(P\) ,然后用多项式除法除以 \(Q_i\) 再每一项除以常数 \(C_i\) 即可得到所需的系数,最后全部加起来得到 \(L(x)\) 的系数。

复杂度

预处理系数:时间复杂度 \(O(n^2)\) ,空间复杂度 \(O(n)\)
单次求值:时间复杂度 \(O(n)\) ,空间复杂度 \(O(1)\)

对横坐标为连续整数的点求解

根据 \(x[] = 1, 2, 3, \cdots, k\) 时的值 \(y[]\)
插值计算不超过 \(k-1\) 次的多项式 \(L\)\(x_0\) 处的取值 \(L(x_0)\)

时间复杂度 \(O(k)\) ,空间复杂度 \(O(MAXK)\)

\(P1[i]\)\(x - i\) 的前缀积,
\(P2[i]\)\(x - i\) 的后缀积,
\(Q[i]\) 是阶乘 \(i!\) 的逆元。

注意:
1. \(k\) 为点的数量, \(MAXK\) 是否足够大?
2. \(y[]\) 是否传入负数?
3. \(int\) 是否可能溢出?
4. \(MOD\) 必须是大于其他所有数字的质数,否则逆元会不存在。

卡常:
1. \(q\) 只与 \(k\) 有关,对于固定的 \(k\) ,可以预处理后多次使用,但是真没什么必要。

使用:
1. 直接调用 int lagrange (int x0, int *y, int k) 即可,其会自动初始化需要的数组,并且可以多次调用。

namespace Lagrange1 {

const int MAXK = 1e6 + 5;
static int P1[MAXK], P2[MAXK], Q[MAXK];

ll qpow (ll x, ll n) {
    ll res = 1;
    for (; n; n >>= 1) {
        if (n & 1) res = res * x % MOD;
        x = x * x % MOD;
    }
    return res;
}

void init_P (int x0, int k) {
    P1[0] = 1;
    for (int i = 1; i <= k; ++i)
        P1[i] = 1LL * P1[i - 1] * (x0 - i) % MOD;
    P2[k + 1] = 1;
    for (int i = k; i >= 1; --i)
        P2[i] = 1LL * P2[i + 1] * (x0 - i) % MOD;
}

void init_Q (int k) {
    if (Q[k] != 0) return;
    Q[k] = 1;
    for (int i = 1; i <= k; ++i)
        Q[k] = 1LL * Q[k] * i % MOD;
    Q[k] = qpow (Q[k], MOD - 2);
    for (int i = k; i >= 1; --i)
        Q[i - 1] = 1LL * Q[i] * i % MOD;
}

int lagrange (int x0, int *y, int k) {
    if (x0 <= k) return y[x0];
    init_P (x0, k);
    init_Q (k);
    int Lx0 = 0;
    for (int i = 1; i <= k; ++i) {
        ll p = 1LL * P1[i - 1] * P2[i + 1] % MOD;
        ll q = 1LL * Q[i - 1] * Q[k - i] % MOD;
        if ( (k - i) & 1) q = MOD - q;
        Lx0 = (Lx0 + p * q % MOD * y[i] % MOD) % MOD;
    }
    return Lx0;
}

};

using Lagrange1::lagrange;

对横坐标为连续整数的点求解(不使用额外空间)

时间复杂度 \(O(k\log{M})\) ,空间复杂度 \(O(1)\)

使用:
1. 直接调用 int lagrange (int x0, int *y, int k) 即可,并且可以多次调用。

namespace Lagrange2 {

ll qpow (ll x, ll n) {
    ll res = 1;
    for (; n; n >>= 1) {
        if (n & 1) res = res * x % MOD;
        x = x * x % MOD;
    }
    return res;
}

ll inv (ll x) {
    return qpow (x, MOD - 2);
}

int lagrange (int x0, int *y, int k) {
    if (x0 <= k)
        return y[x0];
    ll Lx0 = 0, P = 1, Q1 = 1, Q2 = 1;
    for (int i = 1; i <= k; ++i) {
        P = P * (x0 - i) % MOD;
        if (i < k) Q2 = Q2 * (MOD - i) % MOD;
    }
    for (int i = 1; i <= k; ++i) {
        ll p = P * inv (x0 - i) % MOD;
        ll q = inv (Q1 * Q2 % MOD);
        Lx0 = (Lx0 + p * q % MOD * y[i]) % MOD;
        Q1 = Q1 * i % MOD;
        Q2 = Q2 * inv (MOD - k + i) % MOD;
    }
    return Lx0;
}

};

using Lagrange2::lagrange;

拓展

选取等差数列进行插值

例如:求 \(\sum\limits_{i=1}^ni^{k}\) 的值,众所周知,这是一个 \(k+1\) 次多项式,至少需要 \(k+2\) 个点。

这个值有很多种求法,有 \(O(n\log k)\) 的朴素解法(枚举+快速幂),有 \(O(k^2)\) 的系数递推法,使用上述的适用范围广泛的拉格朗日插值法,也可以做到 \(O(k^2)\) ,算法的瓶颈在于计算插值多项式的分母部分。

这里可以选取一些特殊点来加速计算插值多项式的分母部分。例如通过选取一个等差数列,那么这个分母的临项会变得非常有规律。简单起见可以取正整数。

观察分子部分,对每个 \(i\) 来说,分子部分乘上 \((x-x_i)\) 后,都变为公共的 \(\prod\limits_{j=0}^{k}(x-x_j)\) ,那么在使用的时候再把这个 \((x-x_i)\) 除掉就行,复杂度为 \(O(k)\) 预处理,\(O(\log M)\) 单次使用,复杂度为 \(O(k\log M)\)。算法的复杂度瓶颈在于计算分母部分。

观察分母部分,在选取 \(x_i=i\) 后,分母变为两个自然数的前缀积之积,符号是正负交替。更准确地说,第 \(i\) 项的值是: \([\prod\limits_{j=0}^{i-1}(i-j)][\prod\limits_{j=i+1}^{k}(i-j)]=(\prod\limits_{j=1}^{i}j)(\prod\limits_{j=1}^{k-i}j)(-1)^{k-i}\)

由于算法竞赛一般是在模 \(M\) 意义下进行,算上求解逆元时间复杂度应为 \(O(k\log{M})\)

注: \(\sum_{i=1}^ni^{k}\) 的暴力求解其实可以是 \(O(n)\) 的,是使用线性筛去筛出每个数的 \(k\) 次方,然后线性递推出前缀和,不过这实际上是在画蛇添足,因为快速幂的常数实际上很小,而且 \(k\) 本身不大。

卡常:对同一个多项式多次求值时,插值完成后可以保存其分母(毒瘤)。

重心拉格朗日插值法

观察上面这个式子:

\[l_i(x_0)=\prod\limits_{j=1}^{k} [i\neq j]\frac{(x_0-x_j)}{(x_i-x_j)} \]

\[L(x_0)=\sum\limits_{i=1}^{k} y_il_i(x_0) \]

若记 \(g=\prod\limits_{j=1}^{k} (x_0-x_j)\) ,代入上式得到:

\[ L(x_0)=\sum\limits_{i=1}^{k} y_i\prod\limits_{j=1}^{k} [i\neq j]\frac{(x_0-x_j)}{(x_i-x_j)} \\ = g\sum\limits_{i=1}^{k} \prod\limits_{j=1}^{k} [i\neq j]\frac{y_i}{(x_0-x_i)(x_i-x_j)} \]

若记 \(t_i=\prod\limits_{j=1}^{k} [i\neq j]\frac{y_i}{(x_i-x_j)}\) ,代入上式得到

\[L(x_0)= g\sum\limits_{i=1}^{k} \frac{t_i}{(x_0-x_i)} \]

那么增加一个点或者删除一个点,只需要重新计算 \(g\) ,和所有的新的 \(t\) 即可,对于已有的值只需要乘上或者除以变动的差值,对于新的值也是直接求解即可。

TODO:给出代码实现并通过版本3能通过的题目,因为其理论复杂度接近。


验证

https://www.luogu.com.cn/problem/P4781 (使用版本3)
https://codeforces.com/contest/622/problem/F (使用版本1或者版本2)

posted @ 2020-09-15 01:27  purinliang  阅读(797)  评论(0编辑  收藏  举报