All-Pair Almost Shortest Path(APASP)

问题描述

给定一个n个点m条边的无向无权重的图，找出所有点对之间的近似最短距离。

思路

最简单的方法就是从每个点开始跑BFS了。BFS的时间复杂度是 $O (m)$ 的，那么总的时间复杂度就是 $O (n m)$ 的。但是如果是稠密图，那 $O (m) = O (n^{2})$ ，总的时间复杂度就是 $O (n^{3})$ 了。所以思路就是生成边数比较少的子图，然后加上一些构造出来的边来弥补那些被删掉的边造成的影响，再对得到的图跑最短路，来近似给出完整的图的结果。

随机选点

生成边数比较少的子图时，常用的方法是在图中随机选一些点，使得度数 $\geq d$ 的点大概率与某个选出来的点相邻。

假设每个点被选中的概率为 $1 / k$ ，那么一个度数为d的点的邻居中，有一个点被选中的概率就是 $1 - (1 - 1 / k)^{d}$ 。可以证明只要随机选出 $\tilde{O} (n / d)$ 个点即可（我不会证明）。其中 $\tilde{O} (n)$ 表示 $O (n l o g^{c} (n))$ ，其中 $c$ 为常数。

两层图： $\tilde{O} (n^{5 / 2})$

设 $V_{1}$ 为度数 $\geq n^{1 / 2}$ 的点的集合。我们随机选出 $\tilde{O} (n^{1 / 2})$ 个点 $D_{1}$ ，使得所有 $V_{1}$ 中的点高概率与 $D_{1}$ 中的某个点相邻。

令 $E_{2}$ 为满足 $u \notin V_{1}$ 或 $v \notin V_{1}$ 的边(u, v)组成的边集。这样 $E_{2}$ 就相当于我们生成的边数比较少的子图了。由于其中的每条边的两个端点中，其中一方的度数必小于 $n^{1 / 2}$ ，也就是说，我们遍历所有的度数 $n^{1 / 2}$ 的点发出的边，即可遍历到所有的边，然后这样的点的个数最多是n，所以总的边数 $| E_{2} | \leq n \cdot n^{1 / 2} = n^{3 / 2}$ 。

我们在这个子图里对每个点跑BFS的话，对于点对(u, v)，假如u和v以及它们的最短路径上所有的点的度数都小于 $n^{1 / 2}$ ，那么就可以求出来。但是如果路径上存在某个度数 $\geq n^{1 / 2}$ 的点w（有可能是u或v本身），使得最短路径上某条边可能不在 $E_{2}$ 里，我们怎么估计出原图中u和v的最短路呢？

注意到w高概率与 $D_{1}$ 中的某个点w'相邻，所以考虑用w'为跳板，求出u到w'和w'到v的最短距离。记原图中u和v之间的最短距离为 $δ (u, v)$ ，那么 $δ (u, w^{'}) \leq δ (u, w) + 1$ ， $δ (w^{'}, v) \leq δ (w, v) + 1$ ，所以 $δ (u, v) = δ (u, w) + δ (w, v) \leq δ (u, w^{'}) + δ (w^{'}, v) + 2$ ，即误差最大为2。

所以我们先在原图中对每个 $D_{1}$ 中的点跑一遍BFS，拿到 $D_{1} \times V$ 里每个点对的最短距离，这个时间复杂度为 $\tilde{O} (n^{1 / 2} \cdot m) = \tilde{O} (n^{5 / 2})$ 。然后往 $E_{1}$ 中加入权重为 $δ (u, v)$ 的从u到v的边，其中 $u \in D_{1}$ ， $v \in V$ ，加入的这些边的集合记为 $δ (D_{1} \times V)$ ，得到的图则为 $E_{1} \cup δ (D_{1} \times V)$ ，其边数仍然为 $O (n^{3 / 2})$ 。然后对得到的图的每个点跑dijkstra，复杂度 $\tilde{O} (n^{5 / 2})$ ，就能得到误差最多为2的每个点对之间的最短路长度了。总的复杂度就是 $\tilde{O} (n^{5 / 2})$ 。

一些想法：上面的描述中，使用 $E_{2}$ 时，我其实加上了u和v的度数都小于 $n^{1 / 2}$ 的假设，这样其实 $E_{2}$ 里只保留两个端点的度数都小于 $n^{1 / 2}$ 的边就好了，然而这样并不能减少 $E_{2}$ 里的边数，而且这样的话，对于相邻的一个度数小于 $n^{1 / 2}$ ，一个度数 $\geq n^{1 / 2}$ 的点，本来可以都在 $E_{2}$ 里求出精确值，但是却非得以 $D_{1}$ 中的点为跳板，导致可能出现误差。

三层图： $\tilde{O} (n^{7 / 3})$

三层图的结构即一个原图，一个2/3的子图，一个1/3的子图，而且由于同样只用了一个中继点，最大的误差仍然为2。

令 $V_{1}$ 为度数 $\geq n^{2 / 3}$ 的点构成的点集。
令 $V_{2}$ 为度数 $\geq n^{1 / 3}$ 的点构成的点集。
令 $D_{1}$ 为随机选出的 $\tilde{O} (n^{1 / 3})$ 个点，这样 $V_{1}$ 里每个点都大概率与一个 $D_{1}$ 中的点相邻。
令 $D_{2}$ 为随机选出的 $\tilde{O} (n^{2 / 3})$ 个点，这样 $V_{2}$ 里每个点都大概率与一个 $D_{2}$ 中的点相邻。
令 $E_{2}$ 为满足 $u \notin V_{1}$ 或 $v \notin V_{1}$ 的边(u, v)构成的边集。
令 $E_{3}$ 为满足 $u \notin V_{2}$ 或 $v \notin V_{2}$ 的边(u, v)构成的边集。
令 $E^{*}$ 为将每个 $V_{2}$ 中的点连接到一个 $D_{2}$ 中的点的边构成的集合。注意，每个 $V_{2}$ 中的点对应 $E^{*}$ 中的一条边，不然最后的复杂度就不对了。

我们先从 $E_{3}$ 开始考虑。如果我们直接在 $E_{3}$ 上对每个点做BFS，那假如点对(u, v)之间的最短路上所有点（包括u和v）都不属于 $V_{2}$ ，那么求出来的就是精确值。但是，如果路径上存在属于 $V_{2}$ 的点，那么就可能有边不在 $E_{3}$ 中。这时我们考虑引入中继点来弥补。假设w是最后一个属于 $V_{2}$ 的点（可能是v），那么在 $D_{2}$ 中就大概率有一个点w'与w相邻。显然w到v的最短路径上的边都在 $E_{3}$ 里，因此w'到v在 $E_{3} \cup E^{*}$ 上的最短路径长度最多比w到v的最短路径大1。现在问题转化为如何得到u到w'的无误差最短路长度，即每个 $D_{2} \times V$ 中的点对的最短路径长度。

最简单的方法当然是直接在原图上对每个 $D_{2}$ 中的点跑BFS，但是这样的话复杂度太高了。

其实对于三层的图，有一个很美妙的性质：如果u到v的最短路上存在属于 $V_{1}$ 的点w，那么大概率存在一个 $D_{1}$ 中的点w'，使得w'与w相邻，然后只要我们先对每个 $D_{1}$ 中的点跑BFS，得到边集 $δ (D_{1} \times V)$ ，然后只要图中加入这个边集，就能得到这种情况下误差最大为2的最短路长度，跟两层图同理。

这样，我们就只需要求解对于 $D_{2} \times V$ 中的点对，两点之间的最短路径上所有点都 $\notin V_{1}$ 时，最短路径是多少了。我们发现，这些边恰好都在 $E_{2}$ 中。所以我们在 $E_{2}$ 里对每个 $D_{2}$ 中的点跑BFS，得到 $δ_{E_{2}} (D_{2} \times V)$ 。算起点为u的最短路径时，只需要把 $δ_{E_{2}} ({u} \times D_{2})$ 加入到图中即可，不然复杂度不对。

所以总的流程如下：

在原图对每个 $D_{1}$ 中的点跑BFS，得到边集 $δ (D_{1} \times V)$ ，复杂度 $\tilde{O} (n^{7 / 3})$ 。
在 $E_{2}$ 中对每个 $D_{2}$ 中的点跑BFS，得到边集 $δ_{E_{2}} (D_{2} \times V)$ ，由于 $| D_{2} | = \tilde{O} (n^{2 / 3})$ ， $| E_{2} | = O (n^{5 / 3})$ ，所以复杂度 $\tilde{O} (n^{7 / 3})$ 。
对每个点u，在 $E_{3} \cup E^{*} \cup δ (D_{1} \times V) \cup δ_{E_{2}} ({u} \times D_{2}))$ 中对每个点跑dijkstra。由于 $| E_{3} | = O (n^{4 / 3})$ ， $| E^{*} | = O (n)$ ， $| δ (D_{1} \times V) | = \tilde{O} (n^{4 / 3})$ ， $| δ_{E_{2}} ({u} \times D_{2})) | = \tilde{O} (n^{2 / 3})$ ，所以总的边数是 $\tilde{O} (n^{4 / 3})$ ，复杂度是 $\tilde{O} (n^{7 / 3})$ 。

所以最终的复杂度就是 $\tilde{O} (n^{7 / 3})$ 。一切都刚刚好，太妙了orz

推广到多层： $\tilde{O} (k n^{2 + 1 / k})$ ，误差最大为2(k-1)。

分为k层，共k-1个中继节点，所以误差最大为2(k-1)。

令 $V_{i}$ 为度数 $\geq n^{1 - i / k}$ 的点构成的集合。 $V_{k}$ 就是所有点的集合 $V$ 。
令 $D_{i}$ 为随机选出的 $\tilde{O} (n^{i / k})$ 个点，这样每个 $V_{i}$ 中的点都大概率跟某个 $D_{i}$ 中的点相邻。 $D_{k} = V$ 。
令 $E_{i}$ 为满足 $u \notin V_{i - 1}$ 或 $v \notin V_{i - 1}$ 的边(u, v)构成的边集。
令 $E_{i}^{*}$ 为将每个 $V_{i}$ 中的点连接到一个 $D_{i}$ 中的点的边构成的集合。

思路：从i = 1到k，每次求出 $D_{i} \times V$ 中每个点对的误差为2(i-1)的最短路径长度，算完到i = k后，就把 $V \times V$ 中每个点对的误差为2(k-1)的最短路径长度给算出来了，这就是我们要求的。

i = 1的情况，直接在原图上（即 $E_{1}$ ）对每个 $D_{1}$ 中的点做BFS即可。

i > 1的情况，假如我们在 $E_{i}$ 中对每个 $D_{i}$ 中的点跑BFS，那么对于点对(u, v)，假如最短路径上所有点都 $\notin V_{i - 1}$ ，那么求出的就是精确值，否则，设w为最后一个属于 $V_{i - 1}$ 的点，那么大概率存在一个 $w^{'} \in D_{i - 1}$ ，使得w'与w相邻。从w'到v的最短路径长度可以在 $E_{i} \cup E_{i - 1}^{*}$ 中求出来。然后我们又已知 $D_{i - 1} \times V$ 中每个点对的误差为2(i-2)的最短路径长度，假设u到 $D_{i - 1}$ 的最短路径长度构成的边集是 $δ^{'} ({u} \times D_{i - 1})$ ，那么对每个 $u \in D_{i}$ ，以u为起点，在 $E_{i} \cup E_{i - 1}^{*} \cup δ^{'} ({u} \times D_{i - 1})$ 里跑dijkstra即可得到误差最多为2(i-1)的最短路径长度。

因为 $| E_{i} | = O (n^{2 - (i - 1) / k})$ ， $| E_{i - 1}^{*} | = O (n)$ ， $| δ^{'} ({u} \times D_{i - 1}) | = \tilde{O} (n^{(i - 1) / k})$ ，所以跑dijkstra的总边数为 $\tilde{O} (n^{2 - (i - 1) / k})$ ，由于 $| D_{i} | = \tilde{O} (n^{i / k})$ ，所以复杂度为 $\tilde{O} (n^{2 + 1 / k})$ 。跑k次，总复杂度 $k \tilde{O} (n^{2 + 1 / k})$ 。

我的想法：可不可以把三层图里直接把最顶层消掉的方法泛化到这里呢？少一个中继点就可以提高一些精度。

对稀疏图进行优化

注意到，前面的算法在分层的时候只用到了n，但是如果是稀疏图的话，其实高度数的节点是很少的，那其实很多层其实是白分了。所以对稀疏图的优化的思路就是在分层的时候，我们同时用到n和m。论文里给出的分层方法是把原先的 $n^{1 - i / k}$ 改成 $(m / n)^{1 - i / k}$ 。

对k层图使用这个优化后， $V_{i}$ 为度数 $\geq (m / n)^{1 - i / k}$ 的点构成的集合， $| D_{i} | = \tilde{O} (n / (m / n)^{1 - i / k}) = \tilde{O} (n^{2 - i / k} / m^{1 - i / k})$ ， $| E_{i} | = O ((m / n)^{1 - (i - 1) / k} \cdot n) = O (m^{1 - (i - 1) / k} n^{(i - 1) / k})$ ， $| δ^{'} ({u} \times D_{i - 1}) | = \tilde{O} (n^{(i - 1) / k} / m^{1 - (i - 1) / k})$ 。

我们假设 $O (m) \geq O (n)$ ，那么 $| E_{i} \cup E_{i - 1}^{*} \cup δ^{'} ({u} \times D_{i - 1}) | = \tilde{O} (m^{1 - (i - 1) / k} n^{(i - 1) / k})$ ，跑一层的复杂度是 $| D_{i} | | E_{i} | = \tilde{O} (n^{2 - 1 / k} m^{1 / k})$ ，跑k层，复杂度就是 $\tilde{O} (k n^{2 - 1 / k} m^{1 / k})$ 。由于 $O (m) \leq O (n^{2})$ ，所以这个复杂度永远不会比之前的 $k \tilde{O} (n^{2 + 1 / k})$ 更差。

论文：<www.cs.tau.ac.il/~zwick/papers/apasp.ps.gz>

oooooooooooooooooooooooorz

posted @ 2024-09-28 13:41 寻找繁星阅读(10) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 最大流算法复杂度分析

· codeforces-1706-D1-D2

· [算法分析与设计] 1. 全源最短路近似

· [论文阅读报告] Fast 2-Approximate All-Pairs Shortest Paths, SODA '24

· [论文阅读报告] Faster Algorithms for Approximate Distance Oracles and All-Pairs Small Stretch Paths, FOCS '06

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列1：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识？

公告

昵称：寻找繁星
园龄： 4年5个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

寻找繁星

Synced with https://seekstar.github.io

All-Pair Almost Shortest Path(APASP)

问题描述

思路

随机选点

两层图： $\tilde{O} (n^{5 / 2})$

三层图： $\tilde{O} (n^{7 / 3})$

推广到多层： $\tilde{O} (k n^{2 + 1 / k})$ ，误差最大为2(k-1)。

对稀疏图进行优化

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜

寻找繁星

Synced with https://seekstar.github.io

All-Pair Almost Shortest Path(APASP)

问题描述

思路

随机选点

两层图：O~(n5/2)

三层图：O~(n7/3)

推广到多层：O~(kn2+1/k)，误差最大为2(k-1)。

对稀疏图进行优化

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜

两层图： $\tilde{O} (n^{5 / 2})$

三层图： $\tilde{O} (n^{7 / 3})$

推广到多层： $\tilde{O} (k n^{2 + 1 / k})$ ，误差最大为2(k-1)。