POJ 1743 Musical Theme(不可重叠最长重复子串)
题目链接:http://poj.org/problem?id=1743
题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1、长度至少为5个音符。
2、在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3、重复出现的同一主题不能有公共部分。
思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。
先不考虑重叠,重复子串的长度要大于等于k,也就是一个区间内的height值都大于等于k,当出现height小于k则重新定位。
再来考虑重叠,我们知道了一个区间的height都大于等于k,如果存在两个后缀距离大于k,那么可以肯定存在两个长度为k的子串是相同的,且不重叠。
1 #include <cstdio> 2 const int MAXN = 20005; 3 int wa[MAXN], wb[MAXN], wv[MAXN], ws[MAXN]; 4 5 int cmp(int* r, int a, int b, int l) 6 { 7 return r[a] == r[b] && r[a + l] == r[b + l]; 8 } 9 10 /* 11 * r: 原字符串 放在0 - (n-1)位在最后补一个最小字符(ASCLL最小) 12 * sa: 后缀数组 sa[1...n]有效 sa[0]无效 13 * n: 原字符串长度 + 1(后面补了一个字符) 14 * m: 字符大小(ASCLL)的上界 15 */ 16 void Da(int* r, int* sa, int n, int m) 17 { 18 int i, j, p, *x = wa, *y = wb, *t; 19 20 for (i = 0; i < m; ++i) ws[i] = 0; 21 for (i = 0; i < n; ++i) ++ws[x[i] = r[i]]; 22 for (i = 1; i < m; ++i) ws[i] += ws[i - 1]; 23 for (i = n - 1; i >= 0; --i) sa[--ws[x[i]]] = i; 24 25 for (j = 1, p = 1; p < n; j *= 2, m = p) 26 { 27 for (p = 0, i = n - j; i < n; ++i) y[p++] = i; 28 for (i = 0; i < n; ++i) 29 { 30 if (sa[i] >= j) 31 y[p++] = sa[i] - j; 32 } 33 34 for (i = 0; i < n; ++i) wv[i] = x[y[i]]; 35 for (i = 0; i < m; ++i) ws[i] = 0; 36 for (i = 0; i < n; ++i) ++ws[wv[i]]; 37 for (i = 1; i < m; ++i) ws[i] += ws[i - 1]; 38 for (i = n - 1; i >= 0; --i) sa[--ws[wv[i]]] = y[i]; 39 40 t = x; 41 x = y; 42 y = t; 43 x[sa[0]] = 0; 44 45 for (p = 1, i = 1; i < n; ++i) 46 { 47 x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++; 48 } 49 } 50 return; 51 } 52 53 int rank[MAXN]; 54 int height[MAXN]; 55 /* 56 * rank: 名次数组(后缀i在所有后缀中从小到大排列的名次),(以第k个字符开始的后缀称为后缀k)rank[0...n-1]有效 57 * height: height[i] = suffix(sa[i - 1])和suffix(sa[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。height[2...n]有效 58 */ 59 void CalHeight(int* r, int* sa, int n) 60 { 61 int i, j, k = 0; 62 for (i = 1; i <= n; ++i) rank[sa[i]] = i; 63 for (i = 0; i < n; height[rank[i++]] = k) 64 for (k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; ++k); 65 return; 66 } 67 68 bool IsExist(int sa[], int n, int key) 69 { 70 int tMax = sa[1]; 71 int tMin = sa[1]; 72 for (int i = 2; i <= n; ++i) 73 { 74 if (height[i] < key) tMax = tMin = sa[i]; 75 else 76 { 77 if (sa[i] < tMin) tMin = sa[i]; 78 if (sa[i] > tMax) tMax = sa[i]; 79 if (tMax - tMin > key) return true; 80 } 81 } 82 return false; 83 } 84 85 int r[MAXN], sa[MAXN]; 86 87 int main() 88 { 89 int n; 90 while (scanf("%d", &n), n) 91 { 92 --n; 93 int k, t; 94 scanf("%d", &t); 95 for (int i = 0; i < n; ++i) 96 { 97 scanf("%d", &k); 98 r[i] = k - t + 100; 99 t = k; 100 } 101 r[n] = 0; 102 Da(r, sa, n + 1, 200); 103 CalHeight(r, sa, n); 104 int tMin = 4; // 子串最小的长度为4 105 int tMax = n / 2; // 要满足不重叠重复,那么该子串的长度最长为一半 106 int tMid; 107 while (tMin <= tMax) 108 { 109 tMid = (tMin + tMax) / 2; 110 if (IsExist(sa, n, tMid)) tMin = tMid + 1; 111 else tMax = tMid - 1; 112 } 113 if (tMax >= 4) printf("%d\n", tMax + 1); 114 else printf("0\n"); 115 } 116 return 0; 117 }