Alice's Classified Message HDU - 5558 后缀自动机求某个后缀出现的最早位置
题意:
给定一个长度不超过 10W 的只包含小写字母的字符串,从下标 0 到 n−1。从下标 0 开始操作,
每次对于下标 pos查找下标 pos 开始的子串中最长的在其他地方出现过的长度,
其他出现的位置要求起点在位置 pos 之前,然后 pos 移动到这个长度之后继续操作;
如果没有这样的最长串儿就直接 pos++,继续操作,直到 pos=n 结束。
对于上述两种操作,前者输出最大长度 K 以及这种串儿最左边出现的位置;
后者输出 −1 和 s[pos] 的 ASCII码值。
精炼一下题意:就是求出以下标 i 开头的后缀 与【0,i-1】开头的后缀的最长公共前缀
题解:
在线建立后缀自动机,然后将在线匹配即可
然后记录一下对应节点的right集合的最小值就是 某个后缀出现的最早位置
然后L[ i ] - maxlen 就是最早的位置
1 #include <set> 2 #include <map> 3 #include <stack> 4 #include <queue> 5 #include <cmath> 6 #include <ctime> 7 #include <cstdio> 8 #include <string> 9 #include <vector> 10 #include <cstring> 11 #include <iostream> 12 #include <algorithm> 13 #include <unordered_map> 14 15 #define pi acos(-1.0) 16 #define eps 1e-9 17 #define fi first 18 #define se second 19 #define rtl rt<<1 20 #define rtr rt<<1|1 21 #define bug printf("******\n") 22 #define mem(a, b) memset(a,b,sizeof(a)) 23 #define name2str(x) #x 24 #define fuck(x) cout<<#x" = "<<x<<endl 25 #define sfi(a) scanf("%d", &a) 26 #define sffi(a, b) scanf("%d %d", &a, &b) 27 #define sfffi(a, b, c) scanf("%d %d %d", &a, &b, &c) 28 #define sffffi(a, b, c, d) scanf("%d %d %d %d", &a, &b, &c, &d) 29 #define sfL(a) scanf("%lld", &a) 30 #define sffL(a, b) scanf("%lld %lld", &a, &b) 31 #define sfffL(a, b, c) scanf("%lld %lld %lld", &a, &b, &c) 32 #define sffffL(a, b, c, d) scanf("%lld %lld %lld %lld", &a, &b, &c, &d) 33 #define sfs(a) scanf("%s", a) 34 #define sffs(a, b) scanf("%s %s", a, b) 35 #define sfffs(a, b, c) scanf("%s %s %s", a, b, c) 36 #define sffffs(a, b, c, d) scanf("%s %s %s %s", a, b,c, d) 37 #define FIN freopen("../in.txt","r",stdin) 38 #define gcd(a, b) __gcd(a,b) 39 #define lowbit(x) x&-x 40 #define IO iOS::sync_with_stdio(false) 41 42 43 using namespace std; 44 typedef long long LL; 45 typedef unsigned long long ULL; 46 const ULL seed = 13331; 47 const LL INFLL = 0x3f3f3f3f3f3f3f3fLL; 48 const int maxm = 8e6 + 10; 49 const int INF = 0x3f3f3f3f; 50 const int mod = 2012; 51 const int maxn = 1e6 + 7; 52 53 struct Suffix_Automaton { 54 int last, tot, nxt[maxn << 1][26], fail[maxn << 1];//last是未加入此字符前最长的前缀(整个串)所属的节点的编号 55 int len[maxn << 1];// 最长子串的长度 (该节点子串数量 = len[x] - len[fa[x]]) 56 int sz[maxn << 1];// 被后缀链接的个数,方便求节点字符串的个数 57 LL num[maxn << 1];// 该状态子串的数量 58 LL maxx[maxn << 1];// 长度为x的子串出现次数最多的子串的数目 59 LL sum[maxn << 1];// 该节点后面所形成的自字符串的总数 60 LL subnum, sublen;// subnum表示不同字符串数目,sublen表示不同字符串总长度 61 int X[maxn << 1], Y[maxn << 1]; // Y表示排名为x的节点,X表示该长度前面还有多少个 62 int minn[maxn << 1], mx[maxn << 1];//minn[i]表示多个串在后缀自动机i节点最长公共子串,mx[i]表示单个串的最长公共子串 63 int L[maxn << 1]; 64 65 void init() { 66 tot = last = 1; 67 fail[1] = len[1] = 0; 68 for (int i = 0; i < 26; i++) nxt[1][i] = 0; 69 } 70 71 void extend(int c) { 72 int u = ++tot, v = last; 73 for (int i = 0; i <= 25; i++) nxt[u][i] = 0; 74 fail[u] = 0; 75 L[u] = len[u] = len[v] + 1; 76 num[u] = 1; 77 for (; v && !nxt[v][c]; v = fail[v]) nxt[v][c] = u; 78 if (!v) fail[u] = 1, sz[1]++; 79 else if (len[nxt[v][c]] == len[v] + 1) fail[u] = nxt[v][c], sz[nxt[v][c]]++; 80 else { 81 int now = ++tot, cur = nxt[v][c]; 82 len[now] = len[v] + 1; 83 L[now] = L[cur]; 84 memcpy(nxt[now], nxt[cur], sizeof(nxt[cur])); 85 fail[now] = fail[cur]; 86 fail[cur] = fail[u] = now; 87 for (; v && nxt[v][c] == cur; v = fail[v]) nxt[v][c] = now; 88 } 89 last = u; 90 //return len[last] - len[fail[last]];//多添加一个子串所产生不同子串的个数 91 } 92 93 void get_num() {// 每个节点子串出现的次数 94 for (int i = 1; i <= tot; i++) X[i] = 0; 95 for (int i = 1; i <= tot; i++) X[len[i]]++; 96 for (int i = 1; i <= tot; i++) X[i] += X[i - 1]; 97 for (int i = 1; i <= tot; i++) Y[X[len[i]]--] = i; 98 for (int i = tot; i >= 1; i--) num[fail[Y[i]]] += num[Y[i]]; 99 } 100 101 void get_maxx(int n) {// 长度为x的子串出现次数最多的子串的数目 102 get_num(); 103 for (int i = 1; i <= tot; i++) maxx[len[i]] = max(maxx[len[i]], num[i]); 104 } 105 106 void get_sum() {// 该节点后面所形成的自字符串的总数 107 get_num(); 108 for (int i = tot; i >= 1; i--) { 109 sum[Y[i]] = 1; 110 for (int j = 0; j <= 25; j++) 111 sum[Y[i]] += sum[nxt[Y[i]][j]]; 112 } 113 } 114 115 void get_subnum() {//本质不同的子串的个数 116 subnum = 0; 117 for (int i = 1; i <= tot; i++) subnum += len[i] - len[fail[i]]; 118 } 119 120 void get_sublen() {//本质不同的子串的总长度 121 sublen = 0; 122 for (int i = 1; i <= tot; i++) sublen += 1LL * (len[i] + len[fail[i]] + 1) * (len[i] - len[fail[i]]) / 2; 123 } 124 125 void get_sa() { // Y表示排名为x的节点,X表示该长度前面还有多少个 126 for (int i = 0; i <= tot; i++) X[i] = 0; 127 for (int i = 1; i <= tot; i++) X[len[i]]++; 128 for (int i = 1; i <= tot; i++) X[i] += X[i - 1]; 129 for (int i = 1; i <= tot; i++) Y[X[len[i]]--] = i; 130 } 131 132 void match(char s[]) {//多个串的最长公共子串 133 mem(mx, 0); 134 int n = strlen(s), p = 1, maxlen = 0; 135 for (int i = 0; i < n; i++) { 136 int c = s[i] - 'a'; 137 if (nxt[p][c]) p = nxt[p][c], maxlen++; 138 else { 139 for (; p && !nxt[p][c]; p = fail[p]); 140 if (!p) p = 1, maxlen = 0; 141 else maxlen = len[p] + 1, p = nxt[p][c]; 142 } 143 mx[p] = max(mx[p], maxlen); 144 } 145 for (int i = tot; i; i--) 146 mx[fail[i]] = max(mx[fail[i]], min(len[fail[i]], mx[i])); 147 for (int i = tot; i; i--) 148 if (minn[i] == -1 || minn[i] > maxx[i]) minn[i] = mx[i]; 149 } 150 151 void get_kth(int k) {//求出字典序第K的子串 152 int pos = 1, cnt; 153 string s = ""; 154 while (k) { 155 for (int i = 0; i <= 25; i++) { 156 if (nxt[pos][i] && k) { 157 cnt = nxt[pos][i]; 158 if (sum[cnt] < k) k -= sum[cnt]; 159 else { 160 k--; 161 pos = cnt; 162 s += (char) (i + 'a'); 163 break; 164 } 165 } 166 } 167 } 168 cout << s << endl; 169 } 170 171 } sam; 172 173 int T, cas = 1; 174 char s[maxn]; 175 176 int main() { 177 #ifndef ONLINE_JUDGE 178 FIN; 179 #endif 180 sfi(T); 181 while (T--) { 182 sfs(s); 183 int len = strlen(s); 184 sam.init(); 185 printf("Case #%d:\n", cas++); 186 for (int i = 0; i < len;) { 187 int p, maxlen; 188 for (p = 1, maxlen = 0; i < len;) { 189 int c = s[i] - 'a'; 190 if (!sam.nxt[p][c]) break; 191 else { 192 p = sam.nxt[p][c]; 193 sam.extend((s[i] - 'a')); 194 i++, maxlen++; 195 } 196 } 197 if (maxlen) printf("%d %d\n", maxlen, sam.L[p] - maxlen); 198 else printf("-1 %d\n", s[i]), sam.extend((s[i] - 'a')), i++; 199 } 200 } 201 202 #ifndef ONLINE_JUDGE 203 cout << "Totle Time : " << (double) clock() / CLOCKS_PER_SEC << "s" << endl; 204 #endif 205 return 0; 206 }