BZOJ2434:[NOI2011]阿狸的打字机(AC自动机,线段树)
Description
阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B'、'P'两个字母。
经阿狸研究发现,这个打字机是这样工作的:
l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。
l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。
l 按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。
例如,阿狸输入aPaPBbP,纸上被打印的字符如下:
a
aa
ab
我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。
阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?
Input
输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。
第二行包含一个整数m,表示询问个数。
接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。
Output
输出m行,其中第i行包含一个整数,表示第i个询问的答案。
Sample Input
aPaPBbP
3
1 2
1 3
2 3
3
1 2
1 3
2 3
Sample Output
2
1
0
1
0
HINT
1<=N<=10^5
1<=M<=10^5
输入总长<=10^5
Solution
我不会说我因为离线处理完后没有重新排序询问WA了1h
我也不会说我在对拍调试的时候hack了3篇题解
恩看大家这个题都清一色的树状数组……可是我用的线段树
但是因为我不会写树状数组
而且可能我常数小我的线段树跑的并不是很慢
进入正题
一步一步分析
step1
对于给定的字符串,如何建立trie树呢?
这个很简单,和普通AC自动机的插入单词操作差不多
如果当前要处理的是一个小写字母,就往当前节点的儿子走
如果当前是P,意味着从根到当前节点组成了一个单词,记录下这个单词的位置
如果当前是B,那么就往当前节点的父亲走。(毕竟末尾的一个字母删掉了)
step2
建立好trie树顺带把trie树补成trie图且连好fail后,我们考虑暴力
如何判断单词x是否是y的子串呢?
根据AC自动机和fail的定义,我们很容易知道两个结论:
1.trie树上一个节点的祖先节点所代表的单词,肯定是当前所代表的单词的前缀
2.一个节点的fail指针指向的肯定是当前节点所代表的单词的最长后缀
而且子串可以理解为前缀的后缀。
暴力的话就从根到y遍历所有点,对于每个点,我们往上暴跳fail,如果遇到x单词的结尾就ans+1
当然这样分肯定不多就是了……
考虑逆向思维,我们建立一颗fail树。(不知道是啥的先去百度)
那么我们原本是要考虑所有属于y单词的节点有哪些能够暴跳fail指针到x单词结尾
现在就变成了考虑fail树中y单词的节点有哪些在x的子树中了。
还是不是很好搞对么……?那就离线
询问按照y进行排序,然后按照建立trie树的过程重新遍历一遍trie树
这样我们经历单词的顺序肯定是第一个,第二个……第sum个单词
每往下走一步,我们就给到的节点的权值加一
每往上跳一步,我们就给离开的节点的权值减一
当我们跳到第i个单词的时候,就处理询问里y=i的所有情况
就是查询一下fail树中x的子树权值和
这个DFS序+线段树就很好搞了
我也不会说我在对拍调试的时候hack了3篇题解
恩看大家这个题都清一色的树状数组……可是我用的线段树
但是因为我不会写树状数组
而且可能我常数小我的线段树跑的并不是很慢
进入正题
一步一步分析
step1
对于给定的字符串,如何建立trie树呢?
这个很简单,和普通AC自动机的插入单词操作差不多
如果当前要处理的是一个小写字母,就往当前节点的儿子走
如果当前是P,意味着从根到当前节点组成了一个单词,记录下这个单词的位置
如果当前是B,那么就往当前节点的父亲走。(毕竟末尾的一个字母删掉了)
step2
建立好trie树顺带把trie树补成trie图且连好fail后,我们考虑暴力
如何判断单词x是否是y的子串呢?
根据AC自动机和fail的定义,我们很容易知道两个结论:
1.trie树上一个节点的祖先节点所代表的单词,肯定是当前所代表的单词的前缀
2.一个节点的fail指针指向的肯定是当前节点所代表的单词的最长后缀
而且子串可以理解为前缀的后缀。
暴力的话就从根到y遍历所有点,对于每个点,我们往上暴跳fail,如果遇到x单词的结尾就ans+1
当然这样分肯定不多就是了……
考虑逆向思维,我们建立一颗fail树。(不知道是啥的先去百度)
那么我们原本是要考虑所有属于y单词的节点有哪些能够暴跳fail指针到x单词结尾
现在就变成了考虑fail树中y单词的节点有哪些在x的子树中了。
还是不是很好搞对么……?那就离线
询问按照y进行排序,然后按照建立trie树的过程重新遍历一遍trie树
这样我们经历单词的顺序肯定是第一个,第二个……第sum个单词
每往下走一步,我们就给到的节点的权值加一
每往上跳一步,我们就给离开的节点的权值减一
当我们跳到第i个单词的时候,就处理询问里y=i的所有情况
就是查询一下fail树中x的子树权值和
这个DFS序+线段树就很好搞了
Code
1 #include<iostream> 2 #include<cstring> 3 #include<cstdio> 4 #include<queue> 5 #include<algorithm> 6 #define N (1000000+100) 7 using namespace std; 8 struct ST 9 { 10 struct node{int val,add;} Segt[N*4]; 11 void Push(int node,int l,int r) 12 { 13 if (Segt[node].add!=0) 14 { 15 Segt[node<<1].add=Segt[node<<1].add+Segt[node].add; 16 Segt[node<<1|1].add=Segt[node<<1|1].add+Segt[node].add; 17 int mid=(l+r)>>1; 18 Segt[node<<1].val=Segt[node<<1].val+Segt[node].add*(mid-l+1); 19 Segt[node<<1|1].val=Segt[node<<1|1].val+Segt[node].add*(r-mid); 20 Segt[node].add=0; 21 } 22 } 23 void Update(int node,int l,int r,int l1,int r1,int k) 24 { 25 if (r1<l || l1>r) return; 26 if (l1<=l&&r<=r1) 27 { 28 Segt[node].val=Segt[node].val+k*(r-l+1); 29 Segt[node].add=Segt[node].add+k; 30 return; 31 } 32 Push(node,l,r); 33 int mid=(l+r)>>1; 34 Update(node<<1,l,mid,l1,r1,k); 35 Update(node<<1|1,mid+1,r,l1,r1,k); 36 Segt[node].val=Segt[node<<1].val+Segt[node<<1|1].val; 37 } 38 int Query(int node,int l,int r,int l1,int r1) 39 { 40 if (l1>r||r1<l) return 0; 41 if (l1<=l&&r<=r1) return Segt[node].val; 42 Push(node,l,r); 43 int mid=(l+r)>>1; 44 return Query(node<<1,l,mid,l1,r1)+Query(node<<1|1,mid+1,r,l1,r1); 45 } 46 }Segt_Tree; 47 48 struct node{int x,y,num,ans;}ask[N]; 49 struct mode{int to,next;}edge[N]; 50 int Son[N][27],Father[N],End[N],end_num,Fail[N]; 51 int T_NUM[N],cnt,Size[N]; 52 int m,sz,head[N],num_edge; 53 char s[N]; 54 queue<int>q; 55 56 void add(int u,int v) 57 { 58 edge[++num_edge].to=v; 59 edge[num_edge].next=head[u]; 60 head[u]=num_edge; 61 } 62 63 void Build_AC() 64 { 65 int now=0,len=strlen(s); 66 for (int i=0; i<len; ++i) 67 { 68 int x=s[i]-'a'; 69 if (s[i]=='P') 70 { 71 End[++end_num]=now; 72 continue; 73 } 74 if (s[i]=='B') 75 { 76 now=Father[now]; 77 continue; 78 } 79 if (!Son[now][x]) 80 { 81 Son[now][x]=++sz; 82 Father[sz]=now; 83 } 84 now=Son[now][x]; 85 } 86 } 87 88 void Build_Fail() 89 { 90 for (int i=0; i<26; ++i) 91 if (Son[0][i]) 92 q.push(Son[0][i]),add(0,Son[0][i]); 93 while (!q.empty()) 94 { 95 int now=q.front(); 96 q.pop(); 97 for (int i=0; i<26; ++i) 98 { 99 if (!Son[now][i]) 100 { 101 Son[now][i]=Son[Fail[now]][i]; 102 continue; 103 } 104 Fail[Son[now][i]]=Son[Fail[now]][i]; 105 add(Fail[Son[now][i]],Son[now][i]); 106 q.push(Son[now][i]); 107 } 108 } 109 } 110 111 void Dfs(int x) 112 { 113 T_NUM[x]=++cnt; 114 Size[x]=1; 115 for (int i=head[x]; i; i=edge[i].next) 116 Dfs(edge[i].to),Size[x]+=Size[edge[i].to]; 117 } 118 119 bool cmp(node a,node b){return a.y<b.y;} 120 bool cmq(node a,node b){return a.num<b.num;} 121 int main() 122 { 123 scanf("%s",s); 124 Build_AC(); 125 Build_Fail(); 126 Dfs(0); 127 scanf("%d",&m); 128 for (int i=1; i<=m; ++i) 129 scanf("%d%d",&ask[i].x,&ask[i].y),ask[i].num=i; 130 sort(ask+1,ask+m+1,cmp); 131 int now=0,p=1,word_num=0,len=strlen(s); 132 for (int i=0; i<len; ++i) 133 { 134 switch (s[i]) 135 { 136 case 'P': 137 { 138 word_num++; 139 140 while (ask[p].y<word_num && p<=m) p++; 141 while (ask[p].y==word_num && p<=m) 142 { 143 int x=ask[p].x; 144 ask[p].ans=Segt_Tree.Query(1,1,len,T_NUM[End[x]],T_NUM[End[x]]+Size[End[x]]-1); 145 p++; 146 } 147 break; 148 } 149 case 'B': 150 { 151 Segt_Tree.Update(1,1,len,T_NUM[now],T_NUM[now],-1); 152 now=Father[now]; 153 break; 154 } 155 default: 156 { 157 int x=s[i]-'a'; 158 now=Son[now][x]; 159 Segt_Tree.Update(1,1,len,T_NUM[now],T_NUM[now],1); 160 } 161 } 162 } 163 sort(ask+1,ask+m+1,cmq); 164 for (int i=1;i<=m;++i) 165 printf("%d\n",ask[i].ans); 166 }