牛客网暑期ACM多校训练营(第一场)I Substring

题意:给你一个只有abc的字符串,求不相同的子串,(不同构算不同,例如aba和bab算同构)
题解:很显然,如果不考虑同构的问题,我们直接上sa/sam即可,但是这里不行,我们考虑到只有abc三种字符,枚举所有的映射把6个字符串合在一起求不同子串这样每种子串被算了6次,例如ab->(ab,ac,ba,bc,ca,cb)还有单一子串只算了3次例如aa->(aa,bb,cc),那么我们把单一子串乘3加到答案中,再/6即可,考虑到我们需要不能有字符不能是合起来的两端,我们建一个广义sam,每次插入一个串,把last置为1,从头开始插入,最后算不同子串只需要遍历一遍sam,枚举每个状态的可能长度即自己x的长度-fa[x]的长度,怎么算单一子串的长度呢,我们直接在sam上从头跑,跑到没有下一个就break,(刚开始想成了ac自动机,还在fa上跳= =)

//#pragma comment(linker, "/stack:200000000")
//#pragma GCC optimize("Ofast,no-stack-protector")
//#pragma GCC target("sse,sse2,sse3,ssse3,sse4,popcnt,abm,mmx,avx,tune=native")
//#pragma GCC optimize("unroll-loops")
#include<bits/stdc++.h>
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define pi acos(-1.0)
#define ll long long
#define vi vector<int>
#define mod 1000000007
#define C 0.5772156649
#define ls l,m,rt<<1
#define rs m+1,r,rt<<1|1
#define pil pair<int,ll>
#define pli pair<ll,int>
#define pii pair<int,int>
#define cd complex<double>
#define ull unsigned long long
#define base 1000000000000000000
#define fio ios::sync_with_stdio(false);cin.tie(0)
#define Max(a,  b) ((a)>(b)?(a):(b))
inline void add(ll &a,ll b){a+=b;if(a>=mod)a-=mod;}
inline ll gcd(ll a,ll b){return b?gcd(b,a%b):a;}
inline ll qp(ll a,ll b){ll ans=1;while(b){if(b&1)ans=ans*a%mod;a=a*a%mod,b>>=1;}return ans;}

using namespace std;

const double g=10.0,eps=1e-12;
const int N=300000+10,maxn=1500+10,inf=0x3f3f3f3f,INF=0x3f3f3f3f3f3f3f3f;

char s[N],ss[N];
struct SAM{
    int last,cnt;
    int ch[N<<1][3],fa[N<<1],l[N<<1],c[N<<1],a[N<<1];
    void init()
    {
        memset(ch,0,sizeof ch);
        memset(fa,0,sizeof fa);
        memset(c,0,sizeof c);
        memset(l,0,sizeof l);
        memset(a,0,sizeof a);
        cnt=1;
    }
    void ins(int x)
    {
        int p=last,np=++cnt;last=np;l[np]=l[p]+1;
        for(;p&&!ch[p][x];p=fa[p])ch[p][x]=np;
        if(!p)fa[np]=1;
        else
        {
            int q=ch[p][x];
            if(l[q]==l[p]+1)fa[np]=q;
            else
            {
                int nq=++cnt;l[nq]=l[p]+1;
                memcpy(ch[nq],ch[q],sizeof ch[q]);
                fa[nq]=fa[q];fa[q]=fa[np]=nq;
                for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
            }
        }
    }
    void topo()
    {
        for(int i=1;i<=cnt;i++)c[l[i]]++;
        for(int i=1;i<=cnt;i++)c[i]+=c[i-1];
        for(int i=1;i<=cnt;i++)a[c[l[i]]--]=i;
    }
    void build()
    {
        last=1;
        int len=strlen(ss+1);
        for(int i=1;i<=len;i++)ins(ss[i]-'a');
    }
    int gao(int x)
    {
        int len=strlen(s+1),now=1,ans=0;
        for(int i=1;i<=len;i++)
        {
            if(ch[now][x])now=ch[now][x],ans++;
            else break;
        }
//        printf("%d %d\n",x,ans);
        return ans;
    }
    void cal()
    {
        topo();
        ll ans=0;
        for(int i=1;i<=cnt;i++)
           ans+=l[a[i]]-l[fa[a[i]]];
        int res=gao(0)+gao(1)+gao(2);
//        printf("%lld %d\n",ans,res);
        printf("%lld\n",(ans+res)/6);
    }
}sam;
int id[5];
int main()
{
    int n;
    while(~scanf("%d",&n))
    {
        scanf("%s",s+1);
        sam.init();
        for(int i=1;i<=3;i++)id[i]=i;
        do{
            int len=strlen(s+1);
            for(int i=1;i<=len;i++)
                ss[i]=id[s[i]-'a'+1]+'a'-1;
//            puts(ss+1);
            sam.build();
        }while(next_permutation(id+1,id+4));
        sam.cal();
    }
    return 0;
}
/***********************

***********************/

update:今天补多校时突然发现我写的广义sam是错的= =
因为每次只把last变成头了,但是建图过程可能有相同的状态没有合并,这样空间复杂度会比较高
正确的广义sam写法:

//#pragma comment(linker, "/stack:200000000")
//#pragma GCC optimize("Ofast,no-stack-protector")
//#pragma GCC target("sse,sse2,sse3,ssse3,sse4,popcnt,abm,mmx,avx,tune=native")
//#pragma GCC optimize("unroll-loops")
#include<bits/stdc++.h>
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define pi acos(-1.0)
#define ll long long
#define vi vector<int>
#define mod 1000000007
#define C 0.5772156649
#define ls l,m,rt<<1
#define rs m+1,r,rt<<1|1
#define pil pair<int,ll>
#define pli pair<ll,int>
#define pii pair<int,int>
#define cd complex<double>
#define ull unsigned long long
#define base 1000000000000000000
#define fio ios::sync_with_stdio(false);cin.tie(0)
#define Max(a,  b) ((a)>(b)?(a):(b))
inline void add(ll &a,ll b){a+=b;if(a>=mod)a-=mod;}
inline ll gcd(ll a,ll b){return b?gcd(b,a%b):a;}
inline ll qp(ll a,ll b){ll ans=1;while(b){if(b&1)ans=ans*a%mod;a=a*a%mod,b>>=1;}return ans;}

using namespace std;

const double g=10.0,eps=1e-12;
const int N=300000+10,maxn=1500+10,inf=0x3f3f3f3f,INF=0x3f3f3f3f3f3f3f3f;

char s[N],ss[N];
struct SAM{
    int last,cnt;
    int ch[N<<1][3],fa[N<<1],l[N<<1],c[N<<1],a[N<<1];
    void init()
    {
        memset(ch,0,sizeof ch);
        memset(fa,0,sizeof fa);
        memset(c,0,sizeof c);
        memset(l,0,sizeof l);
        memset(a,0,sizeof a);
        cnt=1;
    }
    void ins(int x)
    {
        if(ch[last][x])
        {
            int p=last,q=ch[last][x];
            if(l[q]==l[p]+1)last=q;
            else
            {
                int nq=++cnt;l[nq]=l[p]+1;
                memcpy(ch[nq],ch[q],sizeof ch[q]);
                fa[nq]=fa[q];fa[q]=last=nq;
                for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
            }
            return ;
        }
        int p=last,np=++cnt;last=np;l[np]=l[p]+1;
        for(;p&&!ch[p][x];p=fa[p])ch[p][x]=np;
        if(!p)fa[np]=1;
        else
        {
            int q=ch[p][x];
            if(l[q]==l[p]+1)fa[np]=q;
            else
            {
                int nq=++cnt;l[nq]=l[p]+1;
                memcpy(ch[nq],ch[q],sizeof ch[q]);
                fa[nq]=fa[q];fa[q]=fa[np]=nq;
                for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
            }
        }
    }
    void topo()
    {
        for(int i=1;i<=cnt;i++)c[l[i]]++;
        for(int i=1;i<=cnt;i++)c[i]+=c[i-1];
        for(int i=1;i<=cnt;i++)a[c[l[i]]--]=i;
    }
    void build()
    {
        last=1;
        int len=strlen(ss+1);
        for(int i=1;i<=len;i++)ins(ss[i]-'a');
    }
    int gao(int x)
    {
        int len=strlen(s+1),now=1,ans=0;
        for(int i=1;i<=len;i++)
        {
            if(ch[now][x])now=ch[now][x],ans++;
            else break;
        }
//        printf("%d %d\n",x,ans);
        return ans;
    }
    void cal()
    {
        topo();
        ll ans=0;
        for(int i=1;i<=cnt;i++)
           ans+=l[a[i]]-l[fa[a[i]]];
        int res=gao(0)+gao(1)+gao(2);
//        printf("%lld %d\n",ans,res);
        printf("%lld\n",(ans+res)/6);
    }
}sam;
int id[5];
int main()
{
    int n;
    while(~scanf("%d",&n))
    {
        scanf("%s",s+1);
        sam.init();
        for(int i=1;i<=3;i++)id[i]=i;
        do{
            int len=strlen(s+1);
            for(int i=1;i<=len;i++)
                ss[i]=id[s[i]-'a'+1]+'a'-1;
//            puts(ss+1);
            sam.build();
        }while(next_permutation(id+1,id+4));
        sam.cal();
    }
    return 0;
}
/***********************
4
abaa
4
abab
***********************/
posted @ 2018-07-21 08:35  walfy  阅读(330)  评论(0编辑  收藏  举报