最近公共祖先(LCA)

向上标记法

时间复杂度：\(O(n)\)
待查询点为a和b，首先从a点向根节点进行搜索，将路径上的点进行标记，
再从b点向根节点进行搜索，同时检测路径上的点是否被标记过，第一次检测到的点即为a，b两点的最近公共祖先

倍增

时间复杂度
预处理：\(O(nlog_n)\)
查询: \(O(log_n)\)

相关概念及性质

节点祖先：从根到该节点所经分支上的所有节点，从根节点到此节点的路径中除了此节点本身(但是在最近公共祖先中的祖先可以是节点本身)，其余节点均为此节点的祖先节点，（儿子->父亲->父亲的父亲->...->根)

深度：对于任意节点n，n的深度为从根到n的唯一路径长度，根的深度定为0(为了算法实现的方便，根的深度一般定义为1)

实现思路
为了便于说明算法流程，以一道实际题目为例

\(depth[i]\):节点\(i\)的深度为\(depth[i]\)
\(f[i][k]\):节点i走\(2^k\)步所能到的点为\(f[i][k]\)

预处理以上两个数组，之后对于查询\(lca(a, b)\)

先将两个点跳到同一层(\(depth[a] == depth[b]\))

for (int k = 15; ~k; -- k) // 题中最多40000个点，0~15位二进制最大表示数据为 2^16-1=65535>40000
    if (depth[f[a][k]] >= depth[b]) // 判断要跳到的目标位置与b的位置关系
        a = f[a][k];

如果此时两个点不相同，让两个点同时向上跳，一直跳到它们最近公共祖先的下一层；反之，说明它们本身就为祖孙关系
这里利用二进制拼凑的思想，此时两个点的层数是相同的，目标位置均为最近公共祖先的下一层，故两者要跳的距离也是相同的。设此值为dis

计算一个数的二进制组成时，应当从大数向小数进行尝试.eg：对于11，应当从16开始判断，一直到1
16 8 4 2 1
0 1 0 1 1

按照上述方式，两点初始步幅最大，之后步幅逐渐减小，最终一定可以拼凑出dis步，两点一定可以走到目标位置

从大到小遍历所有步幅，如果两者能够走到同一个点(\(f[a][k] == f[b][k]\))，不走，不能走到同一个点(\(f[a][k] != f[b][k]\))才走

因为\(f[a][k] == f[b][k]\)只能满足该位置是两者的公共祖先，而非最近公共祖先,所以把目标位置定为最近公共祖先的下一层，便于代码实现

if (a == b) return a;
for (int k = 15; ~k; -- k) // 15的理由同上
    if (f[a][k] != f[b][k])
    {
        a = f[a][k];
        b = f[b][k];
    }

如果此时两个点不相同，那么任意一个点再向上走1步即为两点的最近公共祖先

return f[a][0];

上述题目代码实现

#include <iostream>
#include <cstring>
#include <cstdio>
#include <algorithm>
#include <queue>

using namespace std;

const int N = 4e4 + 10, M = N * 2;

int n, m;
int h[N], e[M], ne[M], idx;
int depth[N], f[N][16];
queue<int> q;

void add(int a, int b)
{
    e[idx] = b;
    ne[idx] = h[a];
    h[a] = idx ++;
}
// 更新depth和f
bool bfs(int root)
{
    /** 这里depth起到2个作用：
     * 1. 保存某个点的深度
     * 2. 标记某个点是否已经被搜索过(同样可以通过引入st数组)
     * 将depth初始化为无穷大，通过判断是否为无穷大判断某个点是否被搜索过，depth的初始值只需要是一个非正常值，能够区分已搜索点和未搜索点即可
     */

    memset(depth, 0x3f, sizeof depth);
    depth[0] = 0;    // f[a][k]当k较大时，从a点出发可能超出了根节点，即f[a][k]为0，为保证使用depth[f[a][k]]不出错，定义走不到的点的深度为0，便于区分
    depth[root] = 1; // 由于将走不到的点的深度定义为0，所以根节点的深度定义为1，虽然不符合知识的规定值，但在题目中往往都是相互距离，与真实值不同也无影响
    q.push(root);

    while (q.size())
    {
        int t = q.front();
        q.pop();
        for (int i = h[t]; ~i; i = ne[i])
        {
            int p = e[i];
            if (depth[p] == 0x3f3f3f3f)
            {
                q.push(p);

                depth[p] = depth[t] + 1;

                f[p][0] = t;
                for (int k = 1; k <= 15; ++ k) // f[p][k] 需要用到f[p][k - 1],故需要从小到大
                    f[p][k] = f[f[p][k - 1]][k - 1];
            }
        }   
    }
}
int lca(int a, int b)
{
    if (depth[a] < depth[b]) swap(a, b); // 保证a下b上
    for (int k = 15; ~k; -- k)
        if (depth[f[a][k]] >= depth[b]) // depth[0] = 0，决定了这里从a点出发不会跳转到b点之上
            a = f[a][k];
    if (a == b) return a;
    for (int k = 15; ~k; -- k)
        if (f[a][k] != f[b][k])
        {
            a = f[a][k];
            b = f[b][k];
        }
    return f[a][0];
}
int main()
{
    int root;
    memset(h, -1, sizeof h);
    cin >> n;
    while (n --)
    {
        int a, b;
        cin >> a >> b;
        if (b == -1) root = a;
        else add(a, b), add(b, a);
    }

    bfs(root);

    cin >> m;
    while (m --)
    {
        int a, b;
        cin >> a >> b;
        int p = lca(a, b);
        if (p == a) cout << 1 << endl;
        else if (p == b) cout << 2 << endl;
        else cout << 0 << endl;
    }
    return 0;
}

Tarjan

时间复杂度：\(O(n + m)\)

实现思路
深度优先遍历，将点分类
[1] 正在搜索的点
[2] 已经遍历且回溯过的点
[3] 还未搜索的点

算法有些抽象以一道题目为例进行解释

//      *
//      |1
//      * 
//    2/ \3
//    *   *
/**
 * 两个叶子节点距离 = （2 + 1） - （3 + 1） - 2 * 1
 * Tarjan离线
 */
#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
#include <queue>
#include <vector>

using namespace std;
using PII = pair<int, int>;

const int N = 1e4 + 10, M = N * 2;

int n, m;
int h[N], e[M], ne[M], w[M], idx;
int p[N];
queue<int> q;
int res[M];
int st[N];
int dis[N];
vector<PII> query[M];

int find(int x)
{
    if (p[x] != x) p[x] = find(p[x]);
    return p[x];
}
void add(int a, int b, int c)
{
    e[idx] = b;
    ne[idx] = h[a];
    w[idx] = c;
    h[a] = idx ++;
}
// 初始化各点与根节点的距离
void bfs(int root)
{
    memset(dis, 0x3f, sizeof dis);
    dis[root] = 0;
    q.push(root);

    while (q.size())
    {
        int t = q.front();
        q.pop();

        for (int i = h[t]; ~i; i = ne[i])
        {
            int j = e[i];
            if (dis[j] == 0x3f3f3f3f)
            {
                dis[j] = dis[t] + w[i];
                q.push(j);
            }
        }
    }
}
/**
 * tarjan难在回溯
 * 很多操作之间都存在严格的先后关系，由于结合递归回溯，难理解很多
 */
void tarjan(int x)
{
    st[x] = 1; // 搜索开始
    // 遍历u节点下的所有子节点
    for (int i = h[x]; ~i; i = ne[i])
    {
        int j = e[i];
        if (!st[j]) // st = 0表示不是正在搜索且不是已经搜索完成，是还未搜索
        {
            tarjan(j);
            p[j] = x;
        }
    }

    for (auto question : query[x])
    {
        int y = question.first, id = question.second;
        if (st[y] == 2)
        {
            int ancestor = find(y);
            /**
             * find(y)为什么是最近公共祖先？
             * 这个和tarjan(j)，p[j] = x的先后顺序有关，只有在把以x节点为根节点的子树全部搜索完成后，
             * x节点的p[x]才会更新会上层节点，所以x节点以下的节点所找到的父节点都是x而非整棵树的根节点
             * 比较适合理解这个问题的例子
             *         a
             *         |
             *         b
             *        / \
             *       c   d
             * 询问(c, d)距离
             * tarjan(a) -> tarjan(b) -> tarjan(c), p[c] = b; tarjan(d)
             * p[a] = a     p[b] = b      p[c] = b
             * 因为在d那一层计算(c，d)距离时，p[b] = b并没有更新，但c点的tarjan已经结束
             * 所以p[c]已经更新为b，所以find(c) = b，是c与d的最近公共祖先，而非根节点a
             */
            res[id] = dis[x] + dis[y] - 2 * dis[ancestor];
        }
    }

    st[x] = 2; // 搜索完成
}
int main()
{
    memset(h, -1, sizeof h);
    cin >> n >> m;
    for (int i = 0; i < n - 1; ++ i)
    {
        int a, b, c;
        cin >> a >> b >> c;
        add(a, b, c), add(b, a, c);
    }

    for (int i = 0; i < m; ++ i)
    {
        int a, b;
        cin >> a >> b;
        /**
         * 存储了2次
         * 答案存储依据的是问题编号i，所以多存储并不会影响最终结果
         * 需要存储2次的原因是距离的计算只有在回溯的时候可以计算出来
         * 我们无法确定点与点之间的位置关系，所以需要存储2次数
         */
        query[a].push_back({b, i});
        query[b].push_back({a, i});
    }

    for (int i = 1; i <= n; ++ i) p[i] = i;

    bfs(1); // 初始化各节点距离根节点距离
    tarjan(1);

    for (int i = 0; i < m; ++i) cout << res[i] << endl;

    return 0;
}

posted @ 2021-09-04 14:42 0x7F 阅读(151) 评论(0) 编辑收藏举报

刷新页面返回顶部

ghy

最近公共祖先(LCA)

向上标记法

倍增

Tarjan

公告