求 LCA 的三种方法
(YYL: LCA 有三种求法, 你们都知道么?)
(众神犇: 这哪里来的傻叉...)
1. 树上倍增
对于求 LCA, 最朴素的方法是"让两个点一起往上爬, 直到相遇", "如果一开始不在同一深度, 先爬到同一深度". 树上倍增求 LCA 的方法同样基于这个道理, 只不过利用了倍增思想从而加速了"向上爬"的操作. 也就是说, 每次向上爬的高度不是 1, 而是 2 的幂.
我们用 $f(i, j)$ 表示从节点 $i$ 向上爬 $2^j$ 的高度所到达的节点, 则 $f(i, 0)$ 就代表节点 $i$ 的父节点. 那么对于任意的 $f(i, j), j > 0$, 有
$f(i, j) = f(f(i, j-1), j-1)$.
当我们要求两点的 LCA 时, 先让它们到同一高度. 这个过程我们使用二进制拆分来加速. 比如当两点高度相差 $5$ 时, $(5)_{10} = (101)_2$, 那么我们就让高度较小的那个节点先往上爬 $2^2 = 4$ 步, 再往上 $2^0 = 1$ 步. 此时两点即在同一高度.
如果爬到同一高度后两点相同, 显然这个点就是它们的 LCA, 直接返回即可.
如果两点不同, 就一起往上爬. 这是一个无限逼近的过程, 直到找到它们的 LCA 的子节点为止. 详见代码.
1 for (int i = 1; i <= n; ++i) 2 lg[i] = lg[i - 1] + (1 << lg[i - 1] + 1 == i); 3 4 int lca(int x, int y) { 5 if (dep[x] < dep[y]) 6 swap(x, y); 7 while (dep[x] > dep[y]) 8 x = f[x][lg[dep[x] - dep[y]]]; 9 if (x == y) 10 return x; 11 for (int k = lg[dep[x]]; k >= 0; --k) 12 if (f[x][k] != f[y][k]) 13 x = f[x][k], y = f[y][k]; 14 return f[x][0]; 15 }
(上面的代码预先算出了 $log_2 (n)$ 的值, 从而简化了代码.)
2. Tarjan 算法
Tarjan 算法建立在 DFS 的基础上.
假如我们正在遍历节点 x, 那么根据所有节点各自与 x 的 LCA 是谁, 我们可以将节点进行分类: x 与 x 的兄弟节点的 LCA 是 x 的父亲, x 与 x 的父亲的兄弟节点的 LCA 是 x 的父亲的父亲, x 与 x 的父亲的父亲的兄弟节点的 LCA 是 x 的父亲的父亲的父亲... 将这些类别各自归入不同的集合中, 如果我们能够维护好这些集合, 就能够很轻松地处理有关 x 节点的 LCA 的询问. 显然我们可以使用并查集来维护.
Tarjan 算法的大致步骤如下:
1. 遍历 x 节点的子节点. 对于 x 节点的每个子节点, 该子节点遍历结束之后, 将其整棵子树合并到 x, 并保证合并之后祖先为 x;
2. 将 x 标记为已遍历;
3. 处理有关 x 的询问. 对于询问 (x, y), 如果 y 节点已遍历, 则 x 与 y 的 LCA 就是 y 节点所在集合的祖先; 否则, 将其推迟到遍历 y 时再处理.
代码如下:
1 void tarjan(int u) { 2 fa[u] = u; 3 4 int i, v; 5 for (i = 0; i < tree[u].size(); i++) { 6 v = tree[u][i]; 7 tarjan(v); 8 fa[findset(v)] = u; 9 } 10 11 vis[u] = true; 12 13 for (i = 0; i < query[u].size(); i++) { 14 if (vis[query[u][i]]) { 15 cnt[findset(query[u][i])]++; 16 } 17 } 18 }
(对于保证合并之后集合祖先为 x 这一步骤, 网络上的代码大多使用了一个 ancestor 数组来记录集合的祖先是谁. 原因是如果使用并查集的带秩合并, 合并两个集合之后不好确定根节点到底是谁. 但是带秩合并在有路径压缩的情况下作用有限, 所以这里取消了带秩合并而直接使用 fa[findset(v)] = u 来保证集合的祖先为 u.)
3. LCA 转 RMQ
树上的一些问题可以转化为对树的 DFS 序列的操作. 比如对于这样一棵树:
(图片来自 http://scturtle.is-programmer.com/posts/30055.html)
对于以 3 这个节点为根的整棵子树, 其 DFS 序列为: 3 7 3 8 9 11 9 8 10 12 10 8 3.
假如我们要询问 7 和 12 的 LCA, 我们找到 7 和 12 分别第一次出现的位置, 然后在这一个区间内找到深度最小的那个节点, 也就是节点 3, 显然它就是 7 和 12 的 LCA.
记 DFS 序列为 $S[1...2n]$, 节点 $x$ 在序列 $S$ 中第一次出现的位置为 $E[x]$, 用 $RMQ(L, R)$ 表示序列 $S$ 中深度最小的那个节点. 则
$LCA(u, v) = RMQ(E[u], E[v])$
代码略. DFS + RMQ 的普通做法即可(ST, 线段树等等).