最近公共祖先(LCA)
向上标记法
时间复杂度:\(O(n)\)
待查询点为a和b,首先从a点向根节点进行搜索,将路径上的点进行标记,
再从b点向根节点进行搜索,同时检测路径上的点是否被标记过,第一次检测到的点即为a,b两点的最近公共祖先
倍增
时间复杂度
预处理:\(O(nlog_n)\)
查询: \(O(log_n)\)
相关概念及性质
- 节点祖先:从根到该节点所经分支上的所有节点,从根节点到此节点的路径中除了此节点本身(但是在最近公共祖先中的祖先可以是节点本身),其余节点均为此节点的祖先节点,(儿子->父亲->父亲的父亲->...->根)
- 深度:对于任意节点n,n的深度为从根到n的唯一路径长度,根的深度定为0(为了算法实现的方便,根的深度一般定义为1)
实现思路
为了便于说明算法流程,以一道实际题目为例
\(depth[i]\):节点\(i\)的深度为\(depth[i]\)
\(f[i][k]\):节点i走\(2^k\)步所能到的点为\(f[i][k]\)
预处理以上两个数组,之后对于查询\(lca(a, b)\)
- 先将两个点跳到同一层(\(depth[a] == depth[b]\))
for (int k = 15; ~k; -- k) // 题中最多40000个点,0~15位二进制最大表示数据为 2^16-1=65535>40000
if (depth[f[a][k]] >= depth[b]) // 判断要跳到的目标位置与b的位置关系
a = f[a][k];
- 如果此时两个点不相同,让两个点同时向上跳,一直跳到它们最近公共祖先的下一层;反之,说明它们本身就为祖孙关系
这里利用二进制拼凑的思想,此时两个点的层数是相同的,目标位置均为最近公共祖先的下一层,故两者要跳的距离也是相同的。设此值为dis
计算一个数的二进制组成时,应当从大数向小数进行尝试.eg:对于11,应当从16开始判断,一直到1
16 8 4 2 1
0 1 0 1 1
按照上述方式,两点初始步幅最大,之后步幅逐渐减小,最终一定可以拼凑出dis步,两点一定可以走到目标位置
从大到小遍历所有步幅,如果两者能够走到同一个点(\(f[a][k] == f[b][k]\)),不走,不能走到同一个点(\(f[a][k] != f[b][k]\))才走
因为\(f[a][k] == f[b][k]\)只能满足该位置是两者的公共祖先,而非最近公共祖先,所以把目标位置定为最近公共祖先的下一层,便于代码实现
if (a == b) return a;
for (int k = 15; ~k; -- k) // 15的理由同上
if (f[a][k] != f[b][k])
{
a = f[a][k];
b = f[b][k];
}
- 如果此时两个点不相同,那么任意一个点再向上走1步即为两点的最近公共祖先
return f[a][0];
上述题目代码实现
#include <iostream>
#include <cstring>
#include <cstdio>
#include <algorithm>
#include <queue>
using namespace std;
const int N = 4e4 + 10, M = N * 2;
int n, m;
int h[N], e[M], ne[M], idx;
int depth[N], f[N][16];
queue<int> q;
void add(int a, int b)
{
e[idx] = b;
ne[idx] = h[a];
h[a] = idx ++;
}
// 更新depth和f
bool bfs(int root)
{
/** 这里depth起到2个作用:
* 1. 保存某个点的深度
* 2. 标记某个点是否已经被搜索过(同样可以通过引入st数组)
* 将depth初始化为无穷大,通过判断是否为无穷大判断某个点是否被搜索过,depth的初始值只需要是一个非正常值,能够区分已搜索点和未搜索点即可
*/
memset(depth, 0x3f, sizeof depth);
depth[0] = 0; // f[a][k]当k较大时,从a点出发可能超出了根节点,即f[a][k]为0,为保证使用depth[f[a][k]]不出错,定义走不到的点的深度为0,便于区分
depth[root] = 1; // 由于将走不到的点的深度定义为0,所以根节点的深度定义为1,虽然不符合知识的规定值,但在题目中往往都是相互距离,与真实值不同也无影响
q.push(root);
while (q.size())
{
int t = q.front();
q.pop();
for (int i = h[t]; ~i; i = ne[i])
{
int p = e[i];
if (depth[p] == 0x3f3f3f3f)
{
q.push(p);
depth[p] = depth[t] + 1;
f[p][0] = t;
for (int k = 1; k <= 15; ++ k) // f[p][k] 需要用到f[p][k - 1],故需要从小到大
f[p][k] = f[f[p][k - 1]][k - 1];
}
}
}
}
int lca(int a, int b)
{
if (depth[a] < depth[b]) swap(a, b); // 保证a下b上
for (int k = 15; ~k; -- k)
if (depth[f[a][k]] >= depth[b]) // depth[0] = 0,决定了这里从a点出发不会跳转到b点之上
a = f[a][k];
if (a == b) return a;
for (int k = 15; ~k; -- k)
if (f[a][k] != f[b][k])
{
a = f[a][k];
b = f[b][k];
}
return f[a][0];
}
int main()
{
int root;
memset(h, -1, sizeof h);
cin >> n;
while (n --)
{
int a, b;
cin >> a >> b;
if (b == -1) root = a;
else add(a, b), add(b, a);
}
bfs(root);
cin >> m;
while (m --)
{
int a, b;
cin >> a >> b;
int p = lca(a, b);
if (p == a) cout << 1 << endl;
else if (p == b) cout << 2 << endl;
else cout << 0 << endl;
}
return 0;
}
Tarjan
时间复杂度:\(O(n + m)\)
实现思路
深度优先遍历,将点分类
[1] 正在搜索的点
[2] 已经遍历且回溯过的点
[3] 还未搜索的点
算法有些抽象以一道题目为例进行解释
// *
// |1
// *
// 2/ \3
// * *
/**
* 两个叶子节点距离 = (2 + 1) - (3 + 1) - 2 * 1
* Tarjan离线
*/
#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <queue>
#include <vector>
using namespace std;
using PII = pair<int, int>;
const int N = 1e4 + 10, M = N * 2;
int n, m;
int h[N], e[M], ne[M], w[M], idx;
int p[N];
queue<int> q;
int res[M];
int st[N];
int dis[N];
vector<PII> query[M];
int find(int x)
{
if (p[x] != x) p[x] = find(p[x]);
return p[x];
}
void add(int a, int b, int c)
{
e[idx] = b;
ne[idx] = h[a];
w[idx] = c;
h[a] = idx ++;
}
// 初始化各点与根节点的距离
void bfs(int root)
{
memset(dis, 0x3f, sizeof dis);
dis[root] = 0;
q.push(root);
while (q.size())
{
int t = q.front();
q.pop();
for (int i = h[t]; ~i; i = ne[i])
{
int j = e[i];
if (dis[j] == 0x3f3f3f3f)
{
dis[j] = dis[t] + w[i];
q.push(j);
}
}
}
}
/**
* tarjan难在回溯
* 很多操作之间都存在严格的先后关系,由于结合递归回溯,难理解很多
*/
void tarjan(int x)
{
st[x] = 1; // 搜索开始
// 遍历u节点下的所有子节点
for (int i = h[x]; ~i; i = ne[i])
{
int j = e[i];
if (!st[j]) // st = 0表示不是正在搜索且不是已经搜索完成,是还未搜索
{
tarjan(j);
p[j] = x;
}
}
for (auto question : query[x])
{
int y = question.first, id = question.second;
if (st[y] == 2)
{
int ancestor = find(y);
/**
* find(y)为什么是最近公共祖先?
* 这个和tarjan(j),p[j] = x的先后顺序有关,只有在把以x节点为根节点的子树全部搜索完成后,
* x节点的p[x]才会更新会上层节点,所以x节点以下的节点所找到的父节点都是x而非整棵树的根节点
* 比较适合理解这个问题的例子
* a
* |
* b
* / \
* c d
* 询问(c, d)距离
* tarjan(a) -> tarjan(b) -> tarjan(c), p[c] = b; tarjan(d)
* p[a] = a p[b] = b p[c] = b
* 因为在d那一层计算(c,d)距离时,p[b] = b并没有更新,但c点的tarjan已经结束
* 所以p[c]已经更新为b,所以find(c) = b,是c与d的最近公共祖先,而非根节点a
*/
res[id] = dis[x] + dis[y] - 2 * dis[ancestor];
}
}
st[x] = 2; // 搜索完成
}
int main()
{
memset(h, -1, sizeof h);
cin >> n >> m;
for (int i = 0; i < n - 1; ++ i)
{
int a, b, c;
cin >> a >> b >> c;
add(a, b, c), add(b, a, c);
}
for (int i = 0; i < m; ++ i)
{
int a, b;
cin >> a >> b;
/**
* 存储了2次
* 答案存储依据的是问题编号i,所以多存储并不会影响最终结果
* 需要存储2次的原因是距离的计算只有在回溯的时候可以计算出来
* 我们无法确定点与点之间的位置关系,所以需要存储2次数
*/
query[a].push_back({b, i});
query[b].push_back({a, i});
}
for (int i = 1; i <= n; ++ i) p[i] = i;
bfs(1); // 初始化各节点距离根节点距离
tarjan(1);
for (int i = 0; i < m; ++i) cout << res[i] << endl;
return 0;
}