【BZOJ2434】【NOI2011】阿狸的打字机(AC自动机,树状数组)
【BZOJ2434】阿狸的打字机(AC自动机,树状数组)
先写个暴力:
每次打印出字符串后,就插入到\(Trie\)树中
搞完后直接搭\(AC\)自动机
看一看匹配是怎么样的:
每次沿着\(AC\)自动机走,在每一个节点都跳\(fail\)指针
如果有\(x\)串的末节点,就给答案\(+1\)
这样的话没有必要存下每个串
只要给\(AC\)自动机存一个父亲节点
记录一下每个串的结束位置
倒着往上跳就可以了
这样能够拿到\(40\)分
Update2018.1.25:这份代码对于重复串的处理会有问题,感谢 @超级大蒟蒻
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<set>
#include<map>
#include<vector>
#include<queue>
using namespace std;
#define MAX 200000
inline int read()
{
int x=0,t=1;char ch=getchar();
while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
if(ch=='-')t=-1,ch=getchar();
while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
return x*t;
}
char ss[MAX];
int nd[MAX],n,tot;
struct Node
{
int vis[26];
int fail,fa;
int lt;
}t[MAX];
void GetFail()
{
queue<int> Q;
for(int i=0;i<26;++i)
if(t[0].vis[i])Q.push(t[0].vis[i]);
while(!Q.empty())
{
int u=Q.front();Q.pop();
for(int i=0;i<26;++i)
if(t[u].vis[i])
t[t[u].vis[i]].fail=t[t[u].fail].vis[i],Q.push(t[u].vis[i]);
else t[u].vis[i]=t[t[u].fail].vis[i];
}
}
int Query(int x,int y)
{
int ret=0;
int now=nd[y];
while(now)
{
for(int i=now;i;i=t[i].fail)
if(t[i].lt==x){++ret;break;}
now=t[now].fa;
}
return ret;
}
int main()
{
scanf("%s",ss+1);
int now=0;
for(int i=1,l=strlen(ss+1);i<=l;++i)
{
if(ss[i]>='a'&&ss[i]<='z')
{
if(!t[now].vis[ss[i]-'a'])t[now].vis[ss[i]-'a']=++tot,t[tot].fa=now;
now=t[now].vis[ss[i]-'a'];
}
if(ss[i]=='B')now=t[now].fa;
if(ss[i]=='P'){nd[++n]=now;t[now].lt=n;}
}
int Q=read();
GetFail();
while(Q--)
{
int x=read(),y=read();
printf("%d\n",Query(x,y));
}
return 0;
}
这样子对于每一个询问都会要暴跳
如果对于某个串有重复的多次询问
那么就会多很多次没有任何意义的计算
所以,可以离线把所有询问都按照\(y\)排序
每次跳的时候开个桶一起计算
这样的话可以拿到\(70\)分
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<set>
#include<map>
#include<vector>
#include<queue>
using namespace std;
#define MAX 200000
inline int read()
{
int x=0,t=1;char ch=getchar();
while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
if(ch=='-')t=-1,ch=getchar();
while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
return x*t;
}
char ss[MAX];
int nd[MAX],n,tot;
int ans[MAX];
struct Node
{
int vis[26];
int fail,fa;
int lt;
}t[MAX];
struct Question{int x,y,id,ans;}q[MAX];
bool operator<(Question a,Question b){return a.y<b.y;}
int sum[MAX];
void GetFail()
{
queue<int> Q;
for(int i=0;i<26;++i)
if(t[0].vis[i])Q.push(t[0].vis[i]);
while(!Q.empty())
{
int u=Q.front();Q.pop();
for(int i=0;i<26;++i)
if(t[u].vis[i])
t[t[u].vis[i]].fail=t[t[u].fail].vis[i],Q.push(t[u].vis[i]);
else t[u].vis[i]=t[t[u].fail].vis[i];
}
}
int Query(int y)
{
int ret=0;
int now=nd[y];
while(now)
{
for(int i=now;i;i=t[i].fail)
if(t[i].lt)sum[t[i].lt]++;
now=t[now].fa;
}
return ret;
}
int main()
{
scanf("%s",ss+1);
int now=0;
for(int i=1,l=strlen(ss+1);i<=l;++i)
{
if(ss[i]>='a'&&ss[i]<='z')
{
if(!t[now].vis[ss[i]-'a'])t[now].vis[ss[i]-'a']=++tot,t[tot].fa=now;
now=t[now].vis[ss[i]-'a'];
}
if(ss[i]=='B')now=t[now].fa;
if(ss[i]=='P'){nd[++n]=now;t[now].lt=n;}
}
int Q=read();
GetFail();
for(int i=1;i<=Q;++i)
{
q[i].x=read(),q[i].y=read();
q[i].id=i;
}
sort(&q[1],&q[Q+1]);
for(int i=1,pos=1;i<=Q;i=pos)
{
Query(q[i].y);
while(q[pos].y==q[i].y)q[pos].ans=sum[q[pos].x],pos++;
memset(sum,0,sizeof(sum));
}
for(int i=1;i<=Q;++i)ans[q[i].id]=q[i].ans;
for(int i=1;i<=Q;++i)
printf("%d\n",ans[i]);
return 0;
}
再来想想我们每次在干什么??
跳\(fail\)
显然每个节点有且仅有一个\(fail\)指针
所以,这就是一棵树??
把这个\(fail\)反过来看
现在的问题是什么?
原来是\(y\)的某个节点往上跳能不能到达\(x\)
现在反过来:
\(x\)往下跳能够到达几个\(y\)的节点
那,不就是求子树和???
如果把所有\(y\)的节点全部打上一个\(1\)的标记
那么,每次就变成了求\(x\)末节点的子树和
而一个点的子树在\(dfs\)序上一定是连续的一段
这样还是可以拿到\(70\)分
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<set>
#include<map>
#include<vector>
#include<queue>
using namespace std;
#define MAX 200000
inline int read()
{
int x=0,t=1;char ch=getchar();
while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
if(ch=='-')t=-1,ch=getchar();
while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
return x*t;
}
char ss[MAX];
int nd[MAX],n,tot;
int ans[MAX];
int c[MAX];
int dfn[MAX],low[MAX],tim;
inline int lowbit(int x){return x&(-x);}
void Modify(int x,int w){while(x<=tim)c[x]+=w,x+=lowbit(x);}
int getsum(int x){int ret=0;while(x)ret+=c[x],x-=lowbit(x);return ret;}
struct Node
{
int vis[26];
int fail,fa;
int lt;
}t[MAX];
struct Question{int x,y,id,ans;}q[MAX];
bool operator<(Question a,Question b){return a.y<b.y;}
void GetFail()
{
queue<int> Q;
for(int i=0;i<26;++i)
if(t[0].vis[i])Q.push(t[0].vis[i]);
while(!Q.empty())
{
int u=Q.front();Q.pop();
for(int i=0;i<26;++i)
if(t[u].vis[i])
t[t[u].vis[i]].fail=t[t[u].fail].vis[i],Q.push(t[u].vis[i]);
else t[u].vis[i]=t[t[u].fail].vis[i];
}
}
struct Line{int v,next;}e[MAX<<1];
int h[MAX],cnt=1;
inline void Add(int u,int v){e[cnt]=(Line){v,h[u]};h[u]=cnt++;}
void dfs(int u)
{
dfn[u]=++tim;
for(int i=h[u];i;i=e[i].next)dfs(e[i].v);
low[u]=tim;
}
int main()
{
scanf("%s",ss+1);
int now=0;
for(int i=1,l=strlen(ss+1);i<=l;++i)
{
if(ss[i]>='a'&&ss[i]<='z')
{
if(!t[now].vis[ss[i]-'a'])t[now].vis[ss[i]-'a']=++tot,t[tot].fa=now;
now=t[now].vis[ss[i]-'a'];
}
if(ss[i]=='B')now=t[now].fa;
if(ss[i]=='P'){nd[++n]=now;t[now].lt=n;}
}
int Q=read();
GetFail();
for(int i=1;i<=tot;++i)Add(t[i].fail,i);
dfs(0);
for(int i=1;i<=Q;++i)
{
q[i].x=read(),q[i].y=read();
q[i].id=i;
}
sort(&q[1],&q[Q+1]);
for(int i=1,pos=1;i<=Q;i=pos)
{
for(int now=nd[q[i].y];now;now=t[now].fa)
Modify(dfn[now],1);
while(q[pos].y==q[i].y)
{
int v=nd[q[pos].x];
q[pos].ans=getsum(low[v])-getsum(dfn[v]-1);
pos++;
}
memset(c,0,sizeof(c));
}
for(int i=1;i<=Q;++i)ans[q[i].id]=q[i].ans;
for(int i=1;i<=Q;++i)
printf("%d\n",ans[i]);
return 0;
}
现在大致的方向已经没有问题了
看看我们重复算在哪里?
每次把串插入进树状数组!
因为很多的串会有重复
所以会反反复复把很多东西给重复插进去
这样就很慢了
于是,我们把\(Trie\)树\(dfs\)遍历一遍
我搞Fail指针的时候会把原来的Trie数给搞掉,还要备份。。
访问到的时候打一个\(+1\)
结束的时候打一个\(-1\)
每次访问到一个结束节点的时候,
一定是有且仅有这个串的节点被打了标记
这样就可以直接回答这个串的相关询问了
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<set>
#include<map>
#include<vector>
#include<queue>
using namespace std;
#define MAX 200000
inline int read()
{
int x=0,t=1;char ch=getchar();
while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
if(ch=='-')t=-1,ch=getchar();
while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
return x*t;
}
char ss[MAX];
int nd[MAX],n,tot;
int ans[MAX];
int c[MAX];
int dfn[MAX],low[MAX],tim;
int ql[MAX],qr[MAX];
inline int lowbit(int x){return x&(-x);}
void Modify(int x,int w){while(x<=tim)c[x]+=w,x+=lowbit(x);}
int getsum(int x){int ret=0;while(x)ret+=c[x],x-=lowbit(x);return ret;}
struct Node
{
int vis[26];
int Vis[26];
int fail,fa;
int lt;
}t[MAX];
struct Question{int x,y,id,ans;}q[MAX];
bool operator<(Question a,Question b){return a.y<b.y;}
void GetFail()
{
queue<int> Q;
for(int i=0;i<26;++i)
if(t[0].vis[i])Q.push(t[0].vis[i]);
while(!Q.empty())
{
int u=Q.front();Q.pop();
for(int i=0;i<26;++i)
if(t[u].vis[i])
t[t[u].vis[i]].fail=t[t[u].fail].vis[i],Q.push(t[u].vis[i]);
else t[u].vis[i]=t[t[u].fail].vis[i];
}
}
struct Line{int v,next;}e[MAX<<1];
int h[MAX],cnt=1;
inline void Add(int u,int v){e[cnt]=(Line){v,h[u]};h[u]=cnt++;}
void dfs(int u)
{
dfn[u]=++tim;
for(int i=h[u];i;i=e[i].next)dfs(e[i].v);
low[u]=tim;
}
void DFS(int u)
{
Modify(dfn[u],1);
if(t[u].lt)
for(int i=ql[t[u].lt];i<=qr[t[u].lt];++i)
q[i].ans=getsum(low[nd[q[i].x]])-getsum(dfn[nd[q[i].x]]-1);
for(int i=0;i<26;++i)
if(t[u].Vis[i])
DFS(t[u].Vis[i]);
Modify(dfn[u],-1);
}
int main()
{
scanf("%s",ss+1);
int now=0;
for(int i=1,l=strlen(ss+1);i<=l;++i)
{
if(ss[i]>='a'&&ss[i]<='z')
{
if(!t[now].vis[ss[i]-'a'])t[now].vis[ss[i]-'a']=++tot,t[tot].fa=now;
now=t[now].vis[ss[i]-'a'];
}
if(ss[i]=='B')now=t[now].fa;
if(ss[i]=='P'){nd[++n]=now;t[now].lt=n;}
}
for(int i=0;i<=tot;++i)
for(int j=0;j<26;++j)
t[i].Vis[j]=t[i].vis[j];
int Q=read();
GetFail();
for(int i=1;i<=tot;++i)Add(t[i].fail,i);
dfs(0);
for(int i=1;i<=Q;++i)
{
q[i].x=read(),q[i].y=read();
q[i].id=i;
}
sort(&q[1],&q[Q+1]);
for(int i=1,pos=1;i<=Q;i=pos)
{
ql[q[i].y]=i;
while(q[pos].y==q[i].y)pos++;
qr[q[i].y]=pos-1;
}
DFS(0);
for(int i=1;i<=Q;++i)ans[q[i].id]=q[i].ans;
for(int i=1;i<=Q;++i)
printf("%d\n",ans[i]);
return 0;
}