CF587F-Duff is Mad【AC自动机,根号分治】
正题
题目链接:https://www.luogu.com.cn/problem/CF587F
题目大意
给出\(n\)个字符串\(s\)。\(q\)次询问给出\(l,r,k\)要求输出\(s_{l..r}\)在\(s_k\)中出现了多少次。
\(1\leq n,q,\sum |s_i|\leq 10^5\)
解题思路
考虑一个比较暴力的做法,先把所有的构出一棵\(AC\)自动机,一个串\(S\)有后缀\(T\)当且仅当在\(fail\)树上\(S\)的节点在\(T\)的子树内。
所以暴力的做法就是统计\(s_k\)的节点有多少在\(s_{l..r}\)的终止节点子树内的节点。
需要优化,因为有\(L=\sum |s_i|\leq 10^5\),所以可以考虑根号分治,设定值\(T=\sqrt{L}\)。
对于长度大于\(T\)的\(k\),我们所有的询问统一差分变为前缀问题处理。因为这样的串的个数不会超过\(\sqrt L\)个,所以可以每次暴力\(O(n)\)处理。
我们把所有\(s_k\)路径上的节点权值加一,然后暴力扫描\(n\)个串,每次终止节点统计子树内的权值和。
对于长度小于等于\(T\)的\(k\),我们差分后按照询问端点排序,从左到右扫过\(n\)个串每次子树内的权值加一,然后每次暴力扫描\(s_k\)的所有节点统计权值就好了。
使用树状数组时间复杂度\(O(n\sqrt n\log n)\),已经可以通过本题了。但是如果把树状数组改成分块就可以平衡到\(O(n\sqrt n)\),但是我懒
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<vector>
#include<queue>
#include<cmath>
#define ll long long
#define mp(x,y) make_pair(x,y)
#define lowbit(x) (x&-x)
using namespace std;
const ll N=1e5+10;
struct node{
ll to,next;
}a[N];
ll n,m,T,tot,dfr,L,top[N],ls[N],l[N],t[N],ans[N];
ll cnt,ch[N][26],fail[N],pos[N],rfn[N],ed[N];
vector<pair<ll,ll> > v[N],V[N];
char *s[N],st[N];queue<ll> q;
void Change(ll x,ll val){
while(x<=dfr){
t[x]+=val;
x+=lowbit(x);
}
return;
}
ll Ask(ll x){
ll ans=0;
while(x){
ans+=t[x];
x-=lowbit(x);
}
return ans;
}
void addl(ll x,ll y){
a[++tot].to=y;
a[tot].next=ls[x];
ls[x]=tot;return;
}
ll Insert(char *s,ll l){
ll x=0;
for(ll i=0;i<l;i++){
ll c=s[i]-'a';
if(!ch[x][c])ch[x][c]=++cnt;
x=ch[x][c];
}
return x;
}
void GetFail(){
for(ll i=0;i<26;i++)
if(ch[0][i])q.push(ch[0][i]);
while(!q.empty()){
ll x=q.front();q.pop();
for(ll i=0;i<26;i++){
if(!ch[x][i])ch[x][i]=ch[fail[x]][i];
else{
fail[ch[x][i]]=ch[fail[x]][i];
q.push(ch[x][i]);
}
}
}
for(ll i=1;i<=cnt;i++)addl(fail[i],i);
return;
}
void dfs(ll x,ll fa){
rfn[x]=++dfr;
for(ll i=ls[x];i;i=a[i].next){
ll y=a[i].to;
if(y==fa)continue;
dfs(y,x);
}
ed[x]=dfr;
return;
}
signed main()
{
scanf("%lld%lld",&n,&m);
for(ll i=1;i<=n;i++){
s[i]=st+top[i];
scanf("%s",s[i]);l[i]=strlen(s[i]);
top[i+1]=top[i]+l[i];pos[i]=Insert(s[i],l[i]);
}
L=top[n+1];T=sqrt(L);
GetFail();
dfs(0,0);
for(ll i=1;i<=m;i++){
ll L,R,K;scanf("%lld%lld%lld",&L,&R,&K);
if(l[K]<=T)v[R].push_back(mp(K,i)),v[L-1].push_back(mp(K,-i));
else V[K].push_back(mp(R,i)),V[K].push_back(mp(L-1,-i));
}
for(ll p=1;p<=n;p++)
if(l[p]>T){
memset(t,0,sizeof(t));
sort(V[p].begin(),V[p].end());
ll x=0;
for(ll i=0;i<l[p];i++){
x=ch[x][s[p][i]-'a'];
Change(rfn[x],1);
}
ll z=0,sum=0;
while(z<V[p].size()&&!V[p][z].first)z++;
for(ll i=1;i<=n;i++){
sum+=Ask(ed[pos[i]])-Ask(rfn[pos[i]]-1);
while(z<V[p].size()&&V[p][z].first<=i){
ll id=V[p][z].second,op=1;
if(id<0)id=-id,op=-op;
ans[id]+=sum*op;z++;
}
}
}
memset(t,0,sizeof(t));
for(ll p=1;p<=n;p++){
Change(rfn[pos[p]],1);
Change(ed[pos[p]]+1,-1);
for(ll i=0;i<v[p].size();i++){
ll k=v[p][i].first,id=v[p][i].second,op=1;
if(id<0)id=-id,op=-op;ll x=0;
for(ll j=0;j<l[k];j++){
x=ch[x][s[k][j]-'a'];
ans[id]+=op*Ask(rfn[x]);
}
}
}
for(ll i=1;i<=m;i++)
printf("%lld\n",ans[i]);
return 0;
}