[论文阅读报告] Fast 2-Approximate All-Pairs Shortest Paths, SODA '24

本篇文章介绍 \(\tilde O(n^{2.032})\) 的无向无权图全源最短路 stretch 2 近似算法和 \(\tilde O(n^{\frac 94})\) 的组合算法，以及 \(\tilde O(n^{2.214} (1 / \epsilon)^{O(1)} \log W)\) 的非负整数边权 stretch \((2 + \epsilon)\) 近似算法。其中 \((1 / \epsilon)^{O(1)}\) 表示的是 \(O\left((1 / \epsilon)^{\kappa}\right)\)，\(\kappa\) 是一个常数，但是精确值不方便表示（取决于 \(\omega\) 和 \(2\) 的距离）。

\(\tilde O(n^{2.032})\) 算法的过程与 \(\tilde O(n^{2.2867})\) 无权图上的 surplus 2 近似几乎相同，仅仅有两个改动。

将算法中 \(\tilde O(n^{(2 + r + \omega(r)) / 2})\) 的 Row/Column Bounded-difference \((\min, +)\) 矩阵乘改为 \(\tilde O(n^{\omega(r)} / \epsilon \log W)\) 的整数权重 \((1+\epsilon)\)-近似 \((\min, +)\) 矩阵乘。之后再将 \(\epsilon\) 的影响消除。
将 \(\tilde O\left(n^2 d_0^{\frac 12}\right)\) 的 base case 算法——\(\tilde O\left(n^{\frac 32} m^{\frac 12}\right)\) 的 surplus 2 近似——改为 \(\tilde O\left(m\sqrt n + n^2\right)\) 的。

剩下的算法过程完全沿用。

为什么 surplus 2 的算法可以用于 stretch 2 呢？因为对于长度 \(\geq 2\) 的最短路，surplus 2 比 stretch 2 更强，而长度 \(< 2\) 的最短路是不用算的。

原算法描述如下

将 \(\delta(V \times D_1)\) 视作矩阵，则我们需要求出 \(\delta(V \times D_1) \star \delta(D_1 \times V)\)，其中 \(\star\) 表示 \((\min, +)\) 矩阵乘法。对一般的 \((\min, +)\) 矩阵乘，没有 \(O(n^{3 - \Omega(1)})\) 的做法，但是如果我们将节点序列按照图的任意一棵生成树的欧拉序排列（此时一个点会出现多次），则 \(\delta(D_1 \times V)\) 的上下相邻两个元素的差不超过 \(1\)，对于拥有这样特殊性质的 \((\min, +)\) 矩阵乘（其中一个矩阵为 Row/Column Bounded-difference），有 \(\tilde O(n^{(2 + r + \omega(r))/2})\) 的做法，其中 \(\omega(r)\) 表示 \(n \times n^r\) 矩阵和 \(n^r \times n\) 矩阵做正常矩阵乘法的指数 [Chi-Duan-Xie-Zhang '22]。

算法 0 （无权图上的 surplus \(2\) 近似 III [Deng-Kirkpatrick-Rong-V. Williams-Zhong '22]）

对图 \((V, E)\)，令

\(d_0 \leq d_1 \leq \ldots \leq d_k = n\)，\(k\) 待定。
\(V_i\) 是度数 \(\geq d_i\) 的所有点。
\(D_i\) 是一个大小为 \(\tilde O\left(\frac n{d_i}\right)\) 的关键点集，使得每一个 \(V_i\) 中的点都与至少一个 \(D_i\) 中的点相邻。
\(E_i\) 是 \(u \notin V_i \vee v \notin V_i\) 的所有边 \((u, v)\)。\(|E_i|\leq n{d_i}\)。
\(E^*\) 是每个 \(V_i\) 中的点和任一 \(D_i\) 中的点连接的边集。\(|E^*| = \tilde O(n)\)。

用 BFS 在 \((V, E_i \cup E^*)\) 上计算 \(\delta_i(D_{i-1} \times V)\)，\(1 \leq i \leq k\)，时间复杂度为 \(\tilde O\left(\frac{n^2d_i}{d_{i-1}}\right)\)。

对 \((V, E_0)\) 应用算法 1 得到 \(d'(u, v)\)。时间复杂度 \(O\left(n^2d_0^{\frac 12}\right)\)。

求出 \(\min\limits_{\substack{w' \in D_i \\ 1 \leq i \leq k}}\{\delta_i(u, w') + \delta_i(w', v)\}\)，假设 \(d\) 的选取足够分散，使得 \(k = o(n^\varepsilon)\)，则复杂度为

\[\tilde O\left(n^{(2+(1 - \log_n d_0)+\omega(1 - \log_n d_0))/2}\right) \]

考虑将 \(d(u, v) = \min\left(d'(u, v), \min\limits_{\substack{w' \in D_i \\ 1 \leq i \leq k}}\{\delta_i(u, w') + \delta_i(w', v)\}\right)\) 作为答案。

使用类似上文的推导可知这是一个 surplus \(2\) 近似。

时间复杂度为

\[\tilde O\left(n^2d_0^{\frac 12} + n^2\left(\frac{d_1}{d_0} + \frac{d_2}{d_1} + \ldots + \frac{d_{k-1}}{d_{k-2}} + \frac n{d_{k-1}}\right) + n^{(3-\log_n d_0+\omega(1 - \log_n d_0))/2}\right) \]

可知 \(\frac{d_i}{d_{i-1}}\) 都相等，令他们均为 \(2\)，则 \(k = O(\log n)\)，符合要求。剩下的便是解方程，令 \(d_0 = n^{1 - r}\)，则方程为 \(\frac 52 - \frac 12 r = (2 + r + \omega(r))/2\)，即 \(2r + \omega(r) = 3\)，\(\omega(r)\) 是一个很复杂的函数，查表可以估计出 \(r \approx 0.427\)，最终复杂度 \(\tilde O(n^{2.2867})\)。

有两部分产生了复杂度，一部分是 base case 的 \(\tilde O(n^{\frac 52 - \frac 12 r})\)，另一部分是 \((\min, +)\) 矩阵乘 \(\tilde O(n^{(2 + r + \omega(r)) / 2})\)。

现在，在 stretch 2 中，我们可以将第一部分改为 \(\tilde O(n^{\frac 52 - r})\)，第二部分改为 \(\tilde O(n^{\omega(r)})\)，这样便得到了 \(\tilde O(n^{2.032})\)。

当我们得到了一个 \(\tilde O(n^{\omega} / \epsilon)\) 的 \((1 + \epsilon)\) 近似的 \((\min, +)\) 矩阵乘算法时，我们可以令 \(\epsilon = 1 / \log n\)，这样复杂度为 \(\tilde O(n^{\omega})\)，近似比为 \(2 + 1 / \log n\)。当 \(\delta(u, v) < \log n\) 时，因为要向下取整，这是一个 \(2\) 近似，当 \(\delta(u, v) \geq \log n\) 时，我们可以用 \(\tilde O(n^2)\) surplus \(\log n\) 的做法。

这个做法相当简单，我们原先的 \(\tilde O(n^{7/3})\) surplus \(2\) 的算法中会用 BFS 计算每一层的 \(\delta(D_i \times V)\)，时间复杂度为 \(O(m |D_i|)\)，但现在我们不再每次重新计算，而是直接复用上一轮的结果，这样每一轮的误差会累积。对 surplus \(2(k-1)\) 近似我们可以分 \(k\) 层。

算法 1 （无权图上的 \(\tilde O(n^{2 - 1 / k}m^{1/k})\) surplus \(2(k - 1)\) 近似）

对图 \((V, E)\)，令

\(d_i = (m / n)^{1 - i / k}(\log n)^{i / k}, 1 \leq i \leq k\)。
\(V_i\) 是度数 \(\geq d_i\) 的所有点。
\(D_i\) 是一个大小为 \(\tilde O\left(\frac n{d_i}\right)\) 的关键点集，使得每一个 \(V_i\) 中的点都与至少一个 \(D_i\) 中的点相邻。特别地，令 \(D_k = V\)。
\(E_i\) 是 \(u \notin V_i \vee v \notin V_i\) 的所有边 \((u, v)\)。\(|E_i|\leq n{d_i}\)。
\(E^*\) 是每个 \(V_i\) 中的点和任一 \(D_i\) 中的点连接的边集。\(|E^*| = \tilde O(n)\)。

从 \(1\) 到 \(k\) 枚举 \(i\)，对每个 \(w' \in D_i\)，在 \((V, E_{i - 1} \cup E^* \cup d_{i - 1}(\{w'\} \times V))\) 上跑 Dijkstra。

考虑将 \(d_k(u, v)\) 作为答案。

使用归纳法。使用类似 \(\tilde O(n^{7/3})\) surplus \(2\) 算法的推导可知，最短路上存在 \(w\)，使得 \((w, w') \in E^*, w' \in D_{i - 1}\)，因此 \(u \to w'\) 可以通过 \(d_{i - 1}\) 到达，\(w' \to w \to v\) 可以通过 \(E^* \cup E_{i - 1}\) 到达。当 \(d_{i - 1}\) 的误差为 \(e\) 时，\(d_i\) 的误差为 \(e + 2\)。

由于 \(D_k = V\)，所有 \(d_k(u, v)\) 的误差都不会超过 \(2(k - 1)\)。因此这是一个 surplus \(2(k - 1)\) 近似。

复杂度为 \(\tilde O\left(\frac n{d_1} \cdot m + \sum_{i=2}^k \frac n{d_i} (nd_{i - 1} + n)\right) = \tilde O\left(kn^2 (m / n)^{1 / k}\right) = \tilde O(n^{2 - 1/k}m^{1/k})\)。

我们在原算法的 \(\log n\) 层每一层都运行一遍 \(1 + \frac 1{\log n}\) 近似 \((\min, +)\) 矩阵乘，最后运行一遍 \(\tilde O(n^2)\) surplus \(\log n\) 近似，将两个结果取较小值。

算法 2 （无向无权图上的 stretch \(2\) 近似）

对图 \((V, E)\)，令

\(d_0 \leq d_1 \leq \ldots \leq d_k = n\)，\(k\) 待定。
\(V_i\) 是度数 \(\geq d_i\) 的所有点。
\(D_i\) 是一个大小为 \(\tilde O\left(\frac n{d_i}\right)\) 的关键点集，使得每一个 \(V_i\) 中的点都与至少一个 \(D_i\) 中的点相邻。
\(E_i\) 是 \(u \notin V_i \vee v \notin V_i\) 的所有边 \((u, v)\)。\(|E_i|\leq n{d_i}\)。
\(E^*\) 是每个 \(V_i\) 中的点和任一 \(D_i\) 中的点连接的边集。\(|E^*| = \tilde O(n)\)。

用 BFS 在 \((V, E_i \cup E^*)\) 上计算 \(\delta_i(D_{i-1} \times V)\)，\(1 \leq i \leq k\)，时间复杂度为 \(\tilde O\left(\frac{n^2d_i}{d_{i-1}}\right)\)。

对 \((V, E_0)\) 应用 stretch \(2\) 算法得到 \(d'(u, v)\)。时间复杂度 \(\tilde O\left(n^{3/2}d_0\right)\)。

对 \((V, E)\) 应用 surplus \(\log n\) 算法得到 \(d''(u, v)\)，时间复杂度 \(\tilde O(n^2)\)。

求出 \(\min\limits_{\substack{w' \in D_i \\ 1 \leq i \leq k}}\{\delta_i(u, w') + \delta_i(w', v)\}\) 的近似值，假设 \(d\) 的选取足够分散，使得 \(k = o(n^\varepsilon)\)，则复杂度为

\[\tilde O\left(n^{(2+(1 - \log_n d_0)+\omega(1 - \log_n d_0))/2}\right) \]

考虑将 \(d(u, v) = \min\left(d'(u, v), d''(u, v), \min\limits_{\substack{w' \in D_i \\ 1 \leq i \leq k}}\{\delta_i(u, w') + \delta_i(w', v)\}\right)\) 作为答案。

使用类似上文的推导可知这是一个 stretch \(2\) 近似。

时间复杂度为

\[\tilde O\left(n^{3/2}d_0 + n^2\left(\frac{d_1}{d_0} + \frac{d_2}{d_1} + \ldots + \frac{d_{k-1}}{d_{k-2}} + \frac n{d_{k-1}}\right) + n^{\omega(1 - \log_n d_0)}\right) \]

可知 \(\frac{d_i}{d_{i-1}}\) 都相等，令他们均为 \(2\)，则 \(k = O(\log n)\)，符合要求。剩下的便是解方程，令 \(d_0 = n^{1 - r}\)，则方程为 \(\frac 52 - r = \omega(r)\)，查表可以估计出 \(r \approx 0.4682\)，最终复杂度 \(\tilde O(n^{2.032})\)。

如果我们想要一个组合算法，即不使用快速矩阵乘法的做法，那就是把 \(\tilde O(n^{\omega(r)})\) 改为 \(\tilde O(n^{2 + r})\)，也即使用暴力矩阵乘。这样得到的式子为 \(\frac 52 - r = 2 + r\)，最终复杂度为 \(\tilde O(n^{9/4})\)。这相当于只应用了来自 \(\tilde O(m \sqrt n)\) 算法的加速。

对于 \((2 + \epsilon)\) 近似，我们沿用 \(\tilde O(m \sqrt n)\) 的 \(2\) 近似算法。不过把 \(s \in S_i\) 上的 Dijkstra 改为对 \(\delta(S_i \times V)\) 的 \((1 + \epsilon)\) 近似，这称为多源最短路 (Multi-Source Shortest Path) 近似.

\((1 + \epsilon)\) MSSP 近似的做法和 \((1 + \epsilon)\) 的 APSP 近似非常接近，因为 \(\omega(r, 1, 1) = \omega(1, r, 1)\)。唯一不同的一点在于，当我们计算 \(A_{S \times V} \times A_{V \times V}^i\)（\(A_{X \times Y}\) 为集合 \(X\) 到 \(Y\) 的邻接矩阵）时，我们不能使用快速幂计算 \(A_{V \times V}^{2^i}\)，而是只能每次 \((A_{S \times V} \times A_{V \times V}^{i - 1}) \times A_{V \times V}\)，因此复杂度会多一个 \(n\)，这是我们不想要的。

有一类问题指出我们可以在原图上加少量的边使得所有 \((u, v)\) 都可以经过一条长度不超过 \(\beta\) 的路，使得其权值不超过 \((1 + \epsilon)\) 倍的最短路。称这样的边集为 hopset。

定理对任意带权无向图 \(G = (V, E)\)，\(\kappa > 1\)，存在一个时间复杂度为 \(\tilde O(m n^{1 / \kappa})\) 算法计算 \((1 + \epsilon, \beta)\)-hopset \(H\)，使得 \(\beta = \left(\frac \kappa \epsilon\right)^{O(\kappa)}, |H| = O(n^{1 + 1 / \kappa})\)。

我们令每次矩阵乘法的分辨率 \(R = \beta / \ln(1 + \epsilon)\)，这样最终的近似比可以达到 \((1 + \epsilon)\)。复杂度为 \(\tilde O(n^{\omega(r)} (\kappa / \epsilon)^{O(\kappa)}\log W + mn^{1 / \kappa})\)。

如果 \(\omega(r) = 2\)，\(\epsilon\) 是固定的常数，我们可以对不同的 \(n\) 选择不同的 \(\kappa\)，让 \(\beta = \tilde O(1)\)，比如 \(\log \log n / \log \log \log n\)，这样 \(\kappa^\kappa \leq \log n\)，复杂度为 \(\tilde O(n^2 \log W (1 / \epsilon)^{O(\log \log n / \log \log \log n)})\)。

否则，我们可以选择足够大的常数 \(\kappa\)，使得 \(O(mn^{1 / \kappa}) \leq O(n^{\omega(r)})\)，此时复杂度为 \(\tilde O(n^{\omega(r)}(1 / \epsilon)^{O(1)} \log W)\)。

分两种情况讨论是因为我们也不知道是否有 \(\omega = 2\)，而对于后一种情况，为了保证复杂度是 \(n^{\omega(r)}\) 级别的，\(\omega(r)\) 越小时 \(\kappa\) 越大，\(\omega = 2\) 时我们没有办法做到 \(\tilde O(n^2(1 / \epsilon)^{O(1)} \log W)\)。

就现在而言，我们假设 \(\omega \neq 2\)。这样，在 APSP \((2 + \epsilon)\) 近似中，当 \(|S| = n^r\) 时，计算 \(S, \operatorname{ball}\)、枚举 \(y\) 的复杂度为 \(\tilde O(mn^{1 - r}) = \tilde O(n^{3 - r})\)，运行 \(S_k\) 的复杂度为 \(\tilde O(n^{\omega(r)} (1 / \epsilon)^{O(1)} \log W)\)。平衡后的复杂度为 \(\tilde O(n^{2.214} (1 / \epsilon)^{O(1)} \log W)\)。

posted @ 2024-10-08 14:29 shiys22 阅读(108) 评论(1) 编辑收藏举报

刷新页面返回顶部