洛谷P4248 [AHOI2013]差异(后缀自动机求lcp之和)

题目见此

 

题解:首先所有后缀都在最后一个np节点,然后他们都是从1号点出发沿一些字符边到达这个点的,所以下文称1号点为根节点,我们思考一下什么时候会产生lcp,显然是当他们从根节点开始一直跳相同节点的时候,所以思路就是先找出每个节点被几个后缀经过,这显然把边反转倒着找就可以了,然后他会被出现次数sz个串经过。

出现次数等于parent树子树中np类节点的个数,这跑个dfs就好了,一个相同前缀产生的贡献是sz*(sz-1)/2

然后思考一个点可能代表多个子串,但是他们的出现次数都是相同的,所以单个点的贡献为上面的单个贡献再乘上一个有几个子串

子串的个数为parent树父亲节点的最大长度减去该节点的最大长度

这样子在从根开始dfs,如果经过某个点只有一个后缀经过,就说明lcp结束了,就不用再搜该点了。

上面就求出了lcp的和

至于前面那个式子,只需要打个表找个规律发现是(n-1)*n*(n+1)/2就可以了

虽然常数大点但是还是后缀自动机复杂度的

 

但其实不用这么复杂,只要翻过来就可以建出原串后缀树,lcp就是后缀树的两个节点的lca,跑个树形dp就可以了。

 

代码因为没用链式前向星存边所以不开o2会t,但还是贴一下吧

#include<bits/stdc++.h>
#define N 1000010
using namespace std;

int n;
int gg=0;

struct SAM
{
    struct point
    {
        int son[26],fa,len,mx;
    }t[N];
    
    int cnt=1,last=1;
    int f[N],sz[N];
    bool vis[N];
    vector<int> g[N],e[N];
    long long lcp=0ll; 
    
    void add(int c)
    {
        int p=last;
        int np=++cnt;
        t[np].len=t[p].len+1;
        sz[np]=1;
        while(p&&(!t[p].son[c]))
        {
            t[p].son[c]=np;
            p=t[p].fa;
        }
        if(!p) t[np].fa=1;
        else
        {
            int q=t[p].son[c],nq;
            if(t[p].len+1==t[q].len)
            {
                t[np].fa=q;
            }
            else
            {
                nq=++cnt;
                t[nq]=t[q];
                t[nq].len=t[p].len+1;
                t[q].fa=t[np].fa=nq;
                while(p&&(t[p].son[c]==q))
                {
                    t[p].son[c]=nq;
                    p=t[p].fa; 
                }
            }
        }
        last=np;
    }
    
    void dfs(int now)
    {
        t[now].mx=t[now].len-t[t[now].fa].len;
        for(int i=0;i<26;i++)
        {
            if(t[now].son[i]) e[t[now].son[i]].push_back(now);
        }
        for(int i=0;i<g[now].size();i++)
        {
            dfs(g[now][i]);
            sz[now]+=sz[g[now][i]];
        }
    }
    
    void dfs1(int now)
    {
        vis[now]=1;
        for(int i=0;i<e[now].size();i++)
        {
            f[e[now][i]]++;
            if(!vis[e[now][i]])
            {
                dfs1(e[now][i]);
            }
        }
    }
    
    void dfs3(int now)
    {
        vis[now]=1;
        if(f[now]) lcp+=t[now].mx*(1ll*sz[now]*(sz[now]-1)/2);
        for(int i=0;i<26;i++)
        {
            if(f[t[now].son[i]]&&sz[t[now].son[i]]>1&&(!vis[t[now].son[i]]))
            {
                dfs3(t[now].son[i]);
            }
        }
    }
    
    void solve()
    {
        for(int i=1;i<=cnt;i++) g[t[i].fa].push_back(i);
        dfs(1);
        sz[1]=0;
        memset(vis,0,sizeof(vis));
        dfs1(last);
        memset(vis,0,sizeof(vis)); 
        dfs3(1);
        long long len=1ll*n*(n-1)*(n+1)/2;
        printf("%lld\n",len-2*lcp);
    }
    
}sam;

char s[500050];

int main()
{
    scanf("%s",s);
    n=strlen(s);
    for(int i=0;i<n;i++)
    {
        sam.add(s[i]-'a');
    }
    sam.solve(); 
} 

 

posted @ 2019-02-15 13:50  Styx-ferryman  阅读(645)  评论(1编辑  收藏  举报