求 LCA 的三种方法
(YYL: LCA 有三种求法, 你们都知道么?)
(众神犇: 这哪里来的傻叉...)
1. 树上倍增
对于求 LCA, 最朴素的方法是"让两个点一起往上爬, 直到相遇", "如果一开始不在同一深度, 先爬到同一深度". 树上倍增求 LCA 的方法同样基于这个道理, 只不过利用了倍增思想从而加速了"向上爬"的操作. 也就是说, 每次向上爬的高度不是 1, 而是 2 的幂.
我们用 f(i,j) 表示从节点 i 向上爬 2j 的高度所到达的节点, 则 f(i,0) 就代表节点 i 的父节点. 那么对于任意的 f(i,j),j>0, 有
f(i,j)=f(f(i,j−1),j−1).
当我们要求两点的 LCA 时, 先让它们到同一高度. 这个过程我们使用二进制拆分来加速. 比如当两点高度相差 5 时, (5)10=(101)2, 那么我们就让高度较小的那个节点先往上爬 22=4 步, 再往上 20=1 步. 此时两点即在同一高度.
如果爬到同一高度后两点相同, 显然这个点就是它们的 LCA, 直接返回即可.
如果两点不同, 就一起往上爬. 这是一个无限逼近的过程, 直到找到它们的 LCA 的子节点为止. 详见代码.
1 for (int i = 1; i <= n; ++i) 2 lg[i] = lg[i - 1] + (1 << lg[i - 1] + 1 == i); 3 4 int lca(int x, int y) { 5 if (dep[x] < dep[y]) 6 swap(x, y); 7 while (dep[x] > dep[y]) 8 x = f[x][lg[dep[x] - dep[y]]]; 9 if (x == y) 10 return x; 11 for (int k = lg[dep[x]]; k >= 0; --k) 12 if (f[x][k] != f[y][k]) 13 x = f[x][k], y = f[y][k]; 14 return f[x][0]; 15 }
(上面的代码预先算出了 log2(n) 的值, 从而简化了代码.)
2. Tarjan 算法
Tarjan 算法建立在 DFS 的基础上.
假如我们正在遍历节点 x, 那么根据所有节点各自与 x 的 LCA 是谁, 我们可以将节点进行分类: x 与 x 的兄弟节点的 LCA 是 x 的父亲, x 与 x 的父亲的兄弟节点的 LCA 是 x 的父亲的父亲, x 与 x 的父亲的父亲的兄弟节点的 LCA 是 x 的父亲的父亲的父亲... 将这些类别各自归入不同的集合中, 如果我们能够维护好这些集合, 就能够很轻松地处理有关 x 节点的 LCA 的询问. 显然我们可以使用并查集来维护.
Tarjan 算法的大致步骤如下:
1. 遍历 x 节点的子节点. 对于 x 节点的每个子节点, 该子节点遍历结束之后, 将其整棵子树合并到 x, 并保证合并之后祖先为 x;
2. 将 x 标记为已遍历;
3. 处理有关 x 的询问. 对于询问 (x, y), 如果 y 节点已遍历, 则 x 与 y 的 LCA 就是 y 节点所在集合的祖先; 否则, 将其推迟到遍历 y 时再处理.
代码如下:
1 void tarjan(int u) { 2 fa[u] = u; 3 4 int i, v; 5 for (i = 0; i < tree[u].size(); i++) { 6 v = tree[u][i]; 7 tarjan(v); 8 fa[findset(v)] = u; 9 } 10 11 vis[u] = true; 12 13 for (i = 0; i < query[u].size(); i++) { 14 if (vis[query[u][i]]) { 15 cnt[findset(query[u][i])]++; 16 } 17 } 18 }
(对于保证合并之后集合祖先为 x 这一步骤, 网络上的代码大多使用了一个 ancestor 数组来记录集合的祖先是谁. 原因是如果使用并查集的带秩合并, 合并两个集合之后不好确定根节点到底是谁. 但是带秩合并在有路径压缩的情况下作用有限, 所以这里取消了带秩合并而直接使用 fa[findset(v)] = u 来保证集合的祖先为 u.)
3. LCA 转 RMQ
树上的一些问题可以转化为对树的 DFS 序列的操作. 比如对于这样一棵树:
(图片来自 http://scturtle.is-programmer.com/posts/30055.html)
对于以 3 这个节点为根的整棵子树, 其 DFS 序列为: 3 7 3 8 9 11 9 8 10 12 10 8 3.
假如我们要询问 7 和 12 的 LCA, 我们找到 7 和 12 分别第一次出现的位置, 然后在这一个区间内找到深度最小的那个节点, 也就是节点 3, 显然它就是 7 和 12 的 LCA.
记 DFS 序列为 S[1...2n], 节点 x 在序列 S 中第一次出现的位置为 E[x], 用 RMQ(L,R) 表示序列 S 中深度最小的那个节点. 则
LCA(u,v)=RMQ(E[u],E[v])
代码略. DFS + RMQ 的普通做法即可(ST, 线段树等等).
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程
2012-11-03 POJ1001 高精度浮点数幂运算