牛客网暑期ACM多校训练营(第一场)I Substring
题意:给你一个只有abc的字符串,求不相同的子串,(不同构算不同,例如aba和bab算同构)
题解:很显然,如果不考虑同构的问题,我们直接上sa/sam即可,但是这里不行,我们考虑到只有abc三种字符,枚举所有的映射把6个字符串合在一起求不同子串这样每种子串被算了6次,例如ab->(ab,ac,ba,bc,ca,cb)还有单一子串只算了3次例如aa->(aa,bb,cc),那么我们把单一子串乘3加到答案中,再/6即可,考虑到我们需要不能有字符不能是合起来的两端,我们建一个广义sam,每次插入一个串,把last置为1,从头开始插入,最后算不同子串只需要遍历一遍sam,枚举每个状态的可能长度即自己x的长度-fa[x]的长度,怎么算单一子串的长度呢,我们直接在sam上从头跑,跑到没有下一个就break,(刚开始想成了ac自动机,还在fa上跳= =)
//#pragma comment(linker, "/stack:200000000")
//#pragma GCC optimize("Ofast,no-stack-protector")
//#pragma GCC target("sse,sse2,sse3,ssse3,sse4,popcnt,abm,mmx,avx,tune=native")
//#pragma GCC optimize("unroll-loops")
#include<bits/stdc++.h>
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define pi acos(-1.0)
#define ll long long
#define vi vector<int>
#define mod 1000000007
#define C 0.5772156649
#define ls l,m,rt<<1
#define rs m+1,r,rt<<1|1
#define pil pair<int,ll>
#define pli pair<ll,int>
#define pii pair<int,int>
#define cd complex<double>
#define ull unsigned long long
#define base 1000000000000000000
#define fio ios::sync_with_stdio(false);cin.tie(0)
#define Max(a, b) ((a)>(b)?(a):(b))
inline void add(ll &a,ll b){a+=b;if(a>=mod)a-=mod;}
inline ll gcd(ll a,ll b){return b?gcd(b,a%b):a;}
inline ll qp(ll a,ll b){ll ans=1;while(b){if(b&1)ans=ans*a%mod;a=a*a%mod,b>>=1;}return ans;}
using namespace std;
const double g=10.0,eps=1e-12;
const int N=300000+10,maxn=1500+10,inf=0x3f3f3f3f,INF=0x3f3f3f3f3f3f3f3f;
char s[N],ss[N];
struct SAM{
int last,cnt;
int ch[N<<1][3],fa[N<<1],l[N<<1],c[N<<1],a[N<<1];
void init()
{
memset(ch,0,sizeof ch);
memset(fa,0,sizeof fa);
memset(c,0,sizeof c);
memset(l,0,sizeof l);
memset(a,0,sizeof a);
cnt=1;
}
void ins(int x)
{
int p=last,np=++cnt;last=np;l[np]=l[p]+1;
for(;p&&!ch[p][x];p=fa[p])ch[p][x]=np;
if(!p)fa[np]=1;
else
{
int q=ch[p][x];
if(l[q]==l[p]+1)fa[np]=q;
else
{
int nq=++cnt;l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof ch[q]);
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
}
}
}
void topo()
{
for(int i=1;i<=cnt;i++)c[l[i]]++;
for(int i=1;i<=cnt;i++)c[i]+=c[i-1];
for(int i=1;i<=cnt;i++)a[c[l[i]]--]=i;
}
void build()
{
last=1;
int len=strlen(ss+1);
for(int i=1;i<=len;i++)ins(ss[i]-'a');
}
int gao(int x)
{
int len=strlen(s+1),now=1,ans=0;
for(int i=1;i<=len;i++)
{
if(ch[now][x])now=ch[now][x],ans++;
else break;
}
// printf("%d %d\n",x,ans);
return ans;
}
void cal()
{
topo();
ll ans=0;
for(int i=1;i<=cnt;i++)
ans+=l[a[i]]-l[fa[a[i]]];
int res=gao(0)+gao(1)+gao(2);
// printf("%lld %d\n",ans,res);
printf("%lld\n",(ans+res)/6);
}
}sam;
int id[5];
int main()
{
int n;
while(~scanf("%d",&n))
{
scanf("%s",s+1);
sam.init();
for(int i=1;i<=3;i++)id[i]=i;
do{
int len=strlen(s+1);
for(int i=1;i<=len;i++)
ss[i]=id[s[i]-'a'+1]+'a'-1;
// puts(ss+1);
sam.build();
}while(next_permutation(id+1,id+4));
sam.cal();
}
return 0;
}
/***********************
***********************/
update:今天补多校时突然发现我写的广义sam是错的= =
因为每次只把last变成头了,但是建图过程可能有相同的状态没有合并,这样空间复杂度会比较高
正确的广义sam写法:
//#pragma comment(linker, "/stack:200000000")
//#pragma GCC optimize("Ofast,no-stack-protector")
//#pragma GCC target("sse,sse2,sse3,ssse3,sse4,popcnt,abm,mmx,avx,tune=native")
//#pragma GCC optimize("unroll-loops")
#include<bits/stdc++.h>
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define pi acos(-1.0)
#define ll long long
#define vi vector<int>
#define mod 1000000007
#define C 0.5772156649
#define ls l,m,rt<<1
#define rs m+1,r,rt<<1|1
#define pil pair<int,ll>
#define pli pair<ll,int>
#define pii pair<int,int>
#define cd complex<double>
#define ull unsigned long long
#define base 1000000000000000000
#define fio ios::sync_with_stdio(false);cin.tie(0)
#define Max(a, b) ((a)>(b)?(a):(b))
inline void add(ll &a,ll b){a+=b;if(a>=mod)a-=mod;}
inline ll gcd(ll a,ll b){return b?gcd(b,a%b):a;}
inline ll qp(ll a,ll b){ll ans=1;while(b){if(b&1)ans=ans*a%mod;a=a*a%mod,b>>=1;}return ans;}
using namespace std;
const double g=10.0,eps=1e-12;
const int N=300000+10,maxn=1500+10,inf=0x3f3f3f3f,INF=0x3f3f3f3f3f3f3f3f;
char s[N],ss[N];
struct SAM{
int last,cnt;
int ch[N<<1][3],fa[N<<1],l[N<<1],c[N<<1],a[N<<1];
void init()
{
memset(ch,0,sizeof ch);
memset(fa,0,sizeof fa);
memset(c,0,sizeof c);
memset(l,0,sizeof l);
memset(a,0,sizeof a);
cnt=1;
}
void ins(int x)
{
if(ch[last][x])
{
int p=last,q=ch[last][x];
if(l[q]==l[p]+1)last=q;
else
{
int nq=++cnt;l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof ch[q]);
fa[nq]=fa[q];fa[q]=last=nq;
for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
}
return ;
}
int p=last,np=++cnt;last=np;l[np]=l[p]+1;
for(;p&&!ch[p][x];p=fa[p])ch[p][x]=np;
if(!p)fa[np]=1;
else
{
int q=ch[p][x];
if(l[q]==l[p]+1)fa[np]=q;
else
{
int nq=++cnt;l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof ch[q]);
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for(;ch[p][x]==q;p=fa[p])ch[p][x]=nq;
}
}
}
void topo()
{
for(int i=1;i<=cnt;i++)c[l[i]]++;
for(int i=1;i<=cnt;i++)c[i]+=c[i-1];
for(int i=1;i<=cnt;i++)a[c[l[i]]--]=i;
}
void build()
{
last=1;
int len=strlen(ss+1);
for(int i=1;i<=len;i++)ins(ss[i]-'a');
}
int gao(int x)
{
int len=strlen(s+1),now=1,ans=0;
for(int i=1;i<=len;i++)
{
if(ch[now][x])now=ch[now][x],ans++;
else break;
}
// printf("%d %d\n",x,ans);
return ans;
}
void cal()
{
topo();
ll ans=0;
for(int i=1;i<=cnt;i++)
ans+=l[a[i]]-l[fa[a[i]]];
int res=gao(0)+gao(1)+gao(2);
// printf("%lld %d\n",ans,res);
printf("%lld\n",(ans+res)/6);
}
}sam;
int id[5];
int main()
{
int n;
while(~scanf("%d",&n))
{
scanf("%s",s+1);
sam.init();
for(int i=1;i<=3;i++)id[i]=i;
do{
int len=strlen(s+1);
for(int i=1;i<=len;i++)
ss[i]=id[s[i]-'a'+1]+'a'-1;
// puts(ss+1);
sam.build();
}while(next_permutation(id+1,id+4));
sam.cal();
}
return 0;
}
/***********************
4
abaa
4
abab
***********************/