【图论算法】LCA最近公共祖先问题

LCA模板题https://www.luogu.com.cn/problem/P3379题意理解

对于有根树T的两个结点u、v，最近公共祖先LCA(u,v)表示一个结点x，满足x是u、v的祖先且x的深度尽可能小。另一种理解方式是把T理解为一个无向无环图，而LCA(u,v)即u到v的最短路上深度最小的点。
例如，对于下面的树，结点4和结点6的最近公共祖先LCA(T,4,6)为结点2。

那么这里提供四种思路。

1.暴力至上主义

首先计算出结点u和v的深度d1和d2。如果d1>d2，将u结点向上移动d1-d2步，如果d1<d2，将v结点向上移动d2-d1步，现在u结点和v结点在同一个深度了。下面只需要同时将u，v结点向上移动，直到它们相遇（到达同一个结点）为止，相遇的结点即为u，v结点的最小公共祖先。
但这个算法对于多次询问的题目不能解决。

2.倍增法

思路：倍增法其实是在上一种方法的基础上进行了优化，我们希望向上查找更快，可以事先预处理出p[i,j]，表示i往上移动2^j步到达的结点，这样在查找时将大大节约时间。利用P数组可以快速的将结点i向上移动n步，方法是将n表示为2进制数。比如n=6，二进制为110，那么利用P数组先向上移动4步(2^2)，然后再继续移动2步(2^1)，即P[ P[i][2] ][1]。
那么首先深搜预处理出所有的p[i][j],并计算每个点的深度d[i]:

void dfs(int u,int fa)//从根结点u开始dfs，u的父亲是fa{
    d[u]=d[fa]+1; //u的深度为它父亲的深度+1
    p[u][0]=fa; //u向上走2^0步到达的结点是其父亲
    for(int i=1;(1<<i)<=d[u];i++) p[u][i]=p[p[u][i-1]][i-1];
    //预处理p时，保证能从u走到p[u][i]
    for(int i=head[u];i!=-1;i=e[i].next)//对于u的每个儿子{
    int v=e[i].v;
    if(v!=fa)dfs(v,u); //递归处理以v为根结点的子树}
}

然后在主函数中调用dfs(1,0)即可。接下来是查询结点a,b的LCA：

int lca(int a,int b)
{
    if(d[a]>d[b]) swap(a,b) ; //保证a点在b点上面
    for(int j=20;j>=0;j--) //将b点向上移动到和a的同一深度
           if(d[a]<=d[b]-(1<<j)) b=p[b][j] ;
    if(a==b) return a ;//如果a和b相遇
    for(int j=20;j>=0;j--)//a,b同时向上移动
     {
           if(p[a][j]==p[b][j]) continue ;//如果a,b的2^j祖先相同，则不移动
           a=p[a][j],b=p[b][j];//否则同时移动到2^j处
     }
     return p[a][0] ;//返回最后a的父亲结点
}

时间复杂度分析
预处理：对每一个结点找到它向上走2^logN步到达的点，所以时间是NlogN
一组询问复杂度：O(logn)。
所以总复杂度为NlogN+QlogN
空间复杂度：O(nlogn)。
完整代码：

#include<stdio.h>
#include<iostream>
#define maxn 500000
using namespace std;

int n,m,s,k=0;
int dep[maxn+5],f[maxn+5][21];
int head[maxn+5];
struct edge{int u,v,next;}e[maxn*2+5];

inline int read()
{
   int s=0,w=1;
   char ch=getchar();
   while(ch<'0'||ch>'9'){if(ch=='-')w=-1;ch=getchar();}
   while(ch>='0'&&ch<='9') s=s*10+ch-'0',ch=getchar();
   return s*w;
}

void addedge(int u,int v)
{
    e[++k].u=u;
    e[k].v=v;
    e[k].next=head[u];
    head[u]=k;
}

void deal_first(int u,int father)//递归预处理
{
    dep[u]=dep[father]+1;
    for(int i=0;i<=19;i++)
        f[u][i+1]=f[f[u][i]][i];
    for(int i=head[u];i;i=e[i].next)
    {
        int v=e[i].v;
        if(v==father)    continue;
        f[v][0]=u;
        deal_first(v,u);
    }
}

int LCA(int x,int y)//查询x，y的LCA
{
    if(dep[x]<dep[y])    swap(x,y);//保证x的深度更大
    //先暴力，将x和y的深度调至一样
    for(int i=20;i>=0;i--)//x先跳的幅度大一点
    {
        if(dep[f[x][i]]>=dep[y])    x=f[x][i];
        //x向上移动，使得x，y在同一深度
        if(x==y)    return x;
        //如果恰好x的祖先就是y，直接返回x，不过一般不可能    
    }    
    for(int i=20;i>=0;i--)//x，y同时向上移动，找公共祖先
        if(f[x][i]!=f[y][i])//x，y的父亲不同才往上跳    
            x=f[x][i],y=f[y][i];
    return f[x][0];//最后x和y的父亲一样，返回x的父亲    
}

int main()
{
//    ios::sync_with_stdio(false);
    n=read(),m=read(),s=read();
    int x,y;
    for(int i=1;i<=n-1;i++)
    {
        x=read(),y=read();
        addedge(x,y);
        addedge(y,x);
    }
    deal_first(s,0);//从根节点开始预处理
    for(int i=1;i<=m;i++)
    {
        x=read(),y=read();
        printf("%d\n",LCA(x,y));
    }
    return 0;
}

3.转为RMQ问题

思路：DFS遍历树T，将遍历到的结点按照顺序记下，得到一个长度为2N – 1的序列，称之为T的欧拉序列F。每个结点都在欧拉序列中出现，我们记录结点u在欧拉序列中第一次出现的位置为pos(u)。如下图：

根据DFS的性质，对于结点u、v，从pos(u)遍历到pos(v)的过程中经过LCA(u, v)至少一次，且是深度序列B[pos(u)…pos(v)]中值最小的元素在F中对应的节点。那么我们只需要去找在深度序列B中，pos（u）到pos（v）中最小的位置的欧拉序列值。
即LCA( u, v) = RMQ( pos(u), pos(v))。

用occur[]记录T的欧拉序列，depth[]记录深度，first[]记录各结点第一次出现在欧拉序列中的位置，深搜时：

void dfs(int u,int deep)
 {
     occur[++cnt]=u;//进入该点时进行记录      
     depth[cnt]=deep;     
     if(!first[u]) first[u]=cnt;     
     for(int i=head[u];i!=-1;i=e[i].next)    
     {    
         dfs(e[i].v,deep+1);                      
         occur[++cnt]=u;//访问子树也要标记      
         depth[cnt]=deep;
     }
 }

在这之后还需要进行一次预处理，打一次ST表。
时间复杂度分析：dfs时间为2N，RMQ预处理时间为NlogN，询问Q次，所以总时间复杂度为NlogN+Q
完整代码：

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cmath>
#include<algorithm>
#include<cstring>
#define maxn 500000
using namespace std;

int n,m,s,cnt=0,k=0,head[maxn+10];
struct edge{int u,v,next;}e[maxn*2+10];
int occur[maxn*2+10],depth[maxn*2+10],first[maxn+10];
int minnum[maxn*2+10][20],mindep[maxn*2+10][20];
//mindep记录的是区间内深度最小值
//minnum记录的是区间内深度最小值的编号

inline int read()//快读
{
   int s=0,w=1;
   char ch=getchar();
   while(ch<'0'||ch>'9'){if(ch=='-')w=-1;ch=getchar();}
   while(ch>='0'&&ch<='9') s=s*10+ch-'0',ch=getchar();
   return s*w;
}

void addedge(int x,int y)//建边
{
     e[++k].u=x;
     e[k].v=y;
     e[k].next=head[x];
     head[x]=k;
}

void dfs(int u,int deep)//深搜预处理
{
    cnt++;
    occur[cnt]=u;
    depth[cnt]=deep;
    first[u]=cnt;//记录首次出现的位置
    for(int i=head[u];i!=-1;i=e[i].next)
        if(!first[e[i].v])
        {
            dfs(e[i].v,deep+1);//深搜该节点的枝
            occur[++cnt]=u;//回溯后，仍要将该节点放入欧拉数列
            depth[cnt]=deep;//记录深度
        }
}

void st()//st表求RMQ
{
    for(int i=1;i<=cnt;i++)
        minnum[i][0]=occur[i],mindep[i][0]=depth[i];
    for(int j=1;j<=log(cnt)/log(2);j++){
        for(int i=1;i<=cnt-(1<<j)+1;i++)
        {
            if(mindep[i][j-1]<mindep[i+(1<<(j-1))][j-1])
                mindep[i][j]=mindep[i][j-1],minnum[i][j]=minnum[i][j-1];
            else    
                mindep[i][j]=mindep[i+(1<<(j-1))][j-1],minnum[i][j]=minnum[i+(1<<(j-1))][j-1];
        }
    }
}

int main()
{
    memset(head,-1,sizeof(head));
    n=read(),m=read(),s=read();
    int x,y;
    for(int i=1;i<=n-1;i++)
    {
        x=read(),y=read();
        addedge(y,x);
        addedge(x,y);
    }
    dfs(s,1);
    st();
    for(int i=1;i<=m;i++)
    {
        x=read(),y=read();
        int op=min(first[x],first[y]),ed=max(first[x],first[y]);
        int k=0;
        k=log(ed-op+1)/log(2);
        if(mindep[op][k]<mindep[ed-(1<<k)+1][k])    
            printf("%d\n",minnum[op][k]);
        else    printf("%d\n",minnum[ed-(1<<k)+1][k]);
    }
    return 0;
}

4.Tarjan

别说了，说多了都是泪。思路：先把所有的询问存下来，然后在DFS的过程中根据点被访问的状态求出每个询问的答案，DFS完后按询问顺序输出。需要用到并查集。
相比前两个算法，这是离线算法。优势在于稳定，且时间复杂度适中。

实现过程
DFS遍历树，利用并查集，当某个节点u及其子树遍历完成后,处理所有与u相关的查询。
1)当遍历到u时，创建u的并查集U={u},集合U的代表为u
2)对u的每一个子树进行DFS遍历,每搜索完一棵子树,将子树标记为checked,把子树所形成的集合与集合U合并，且集合U的代表仍为u
3)按步骤2)继续遍历u的下一棵子树，直到u的所有子树都遍历完,此时将u设为checked
4)处理所有与u相关的查询(u,v)
若v的状态为checked,则LCA(u,v)=present(v)
若v的状态不是checked，跳过这个查询(u,v)，当遍历到节点v时，u必然为checked，同样可以求得lca(u,v)

void tarjan(int u)
{
    father[u]=u;//以u作为父亲建立一个独立并查集
    vis[u]=true;
    for(int i=head[u];i!=-1;i=e[i].next)
    {
        int v=e[i].v;
        if(!vis[v])
        {
            tarjan(v);
            father[v]=u;
        }
    }
    //深搜寻找叶子节点，再向上回溯
    for(int i=0;i<q[u].size();i++)
        if(vis[q[u][i].first]&&!ans[q[u][i].second])    
        //如果这个点的并查集已被查询完，并且还没有得出答案
            ans[q[u][i].second]=find(q[u][i].first);
        //第i号询问就是q[u][i].first的父亲
        //同时对并查集的祖先进行刷新
}

时间复杂度分析：Tarjan的时间为N，每个询问O(1),所以总时间为N+Q
完整代码：

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<algorithm>
#include<cmath>
#include<cstring>
#include<vector>
#define maxn 500000
using namespace std;

int n,m,s,cnt=0,k=0,head[maxn+10];
struct edge{int u,v,next;}e[maxn*2+10];
int ans[maxn+10],father[maxn+10];
bool vis[maxn+10];
typedef pair<int,int> pii;
vector<pii> q[maxn+10];

inline int read()
{
    int ans=0,flag=1;
    char ch=getchar();
    while(ch<'0'||ch>'9')
    {
        if(ch=='-')    flag=-1;
        ch=getchar();
    }    
    while(ch>='0'&&ch<='9')
        ans=ans*10+ch-'0',ch=getchar();
    return ans*flag;
}

void addedge(int u,int v)
{
    e[++k].u=u;
    e[k].v=v;
    e[k].next=head[u];
    head[u]=k;
}

int find(int x){return father[x]==x?x:father[x]=find(father[x]);}

void tarjan(int u)
{
    father[u]=u;//以u作为父亲建立一个独立并查集
    vis[u]=true;
    for(int i=head[u];i!=-1;i=e[i].next)
    {
        int v=e[i].v;
        if(!vis[v])
        {
            tarjan(v);
            father[v]=u;
        }
    }
    //深搜寻找叶子节点，再向上回溯
    for(int i=0;i<q[u].size();i++)
        if(vis[q[u][i].first]&&!ans[q[u][i].second])    
        //如果这个点的并查集已被查询完，并且还没有得出答案
            ans[q[u][i].second]=find(q[u][i].first);
        //第i号询问就是q[u][i].first的父亲
        //同时对并查集的祖先进行刷新
}

int main()
{
    memset(head,-1,sizeof(head));
    n=read(),m=read(),s=read();
    int u,v;
    for(int i=1;i<=n-1;i++)
    {
        u=read(),v=read();
        addedge(u,v);
        addedge(v,u);
    }
    for(int i=1;i<=m;i++)
    {
        u=read(),v=read();
        q[u].push_back(make_pair(v,i));
        q[v].push_back(make_pair(u,i));
    }//不定长数组存储询问
    tarjan(s);
    for(int i=1;i<=m;i++)
        printf("%d\n",ans[i]);
     return 0;
}

posted @ 2020-04-19 17:44 初学者Ming 阅读(201) 评论(0) 收藏举报

刷新页面返回顶部

初学者Ming