POJ_3294

    首先,我们可以把这几个序列合并成一个序列,并且在之间加入一些分隔符,但这些分隔符最好用不一样的且不同于序列中的字符的整数表示,这样在后面寻找后缀间的公共前缀时就避免了把分隔符也匹配进去的情况。

    接着,我们只要二分字符串的长度k,并依height[]的值将height[]看成若干组,每组中height[]的值均不小于k。如果这一组中涵盖的不同的序列的数量大于N/2,那么就说明满足题意的字符串的长度至少为k。

    找到k的值后再遍历一遍height数组,将符合要求的前缀的首字符的位置记录下来即可,根据首字符的位置和k的值就可以输出满足题意的字符串了。同时,由于是遍历height数组,先找到的解的一定是字典序较小的解。

#include<stdio.h>
#include<string.h>
#define MAXD 101000
#define INF 0x3f3f3f3f
char b[MAXD];
int N, M, P, f[MAXD], r[MAXD], sa[MAXD], rank[MAXD], height[MAXD], wa[MAXD], wb[MAXD], ws[MAXD], wv[MAXD];
int h[110], ans[MAXD];
void init()
{
int i, j, k, x = 128;
k = 0;
for(i = 0; i < N; i ++)
{
scanf("%s", b);
for(j = 0; b[j]; j ++, k ++)
{
r[k] = b[j];
f[k] = i;
}
r[k] = x ++, f[k] = -1;
++ k;
}
M = k - 1;
r[M] = 0;
}
int cmp(int *p, int x, int y, int l)
{
return p[x] == p[y] && p[x + l] == p[y + l];
}
void da(int n, int m)
{
int i, j, p, *x = wa, *y = wb, *t;
for(i = 0; i < m; i ++)
ws[i] = 0;
for(i = 0; i < n; i ++)
++ ws[x[i] = r[i]];
for(i = 1; i < m; i ++)
ws[i] += ws[i - 1];
for(i = n - 1; i >= 0; i --)
sa[-- ws[x[i]]] = i;
for(j = p = 1; p < n; j *= 2, m = p)
{
for(p = 0, i = n - j; i < n; i ++)
y[p ++] = i;
for(i = 0; i < n; i ++)
if(sa[i] >= j)
y[p ++] = sa[i] - j;
for(i = 0; i < n; i ++)
wv[i] = x[y[i]];
for(i = 0; i < m; i ++)
ws[i] = 0;
for(i = 0; i < n; i ++)
++ ws[wv[i]];
for(i = 1; i < m; i ++)
ws[i] += ws[i - 1];
for(i = n - 1; i >= 0; i --)
sa[-- ws[wv[i]]] = y[i];
for(t = x, x = y, y = t, x[sa[0]] = 0, i = p = 1; i < n; i ++)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p ++;
}
}
void calheight(int n)
{
int i, j, k = 0;
for(i = 1; i <= n; i ++)
rank[sa[i]] = i;
for(i = 0; i < n; height[rank[i ++]] = k)
for(k ? -- k : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; k ++);
}
int check(int mid)
{
int i, j, k, p;
for(i = 1; i <= M; i ++)
{
if(height[i] < mid)
k = 0;
else
{
if(k == 0)
{
memset(h, 0, sizeof(h));
h[f[sa[i - 1]]] = 1;
p = sa[i - 1];
k = 1;
}
if(!h[f[sa[i]]])
{
h[f[sa[i]]] = 1;
++ k;
}
if(k > N / 2)
return 1;
}
}
return 0;
}
void printresult(int mid)
{
int i, j, k = 0, p, n = 0;
for(i = 1; i <= M; i ++)
{
if(height[i] < mid)
{
if(k > N / 2)
ans[n ++] = p;
k = 0;
}
else
{
if(k == 0)
{
memset(h, 0, sizeof(h));
h[f[sa[i - 1]]] = 1;
p = sa[i - 1];
k = 1;
}
if(!h[f[sa[i]]])
{
h[f[sa[i]]] = 1;
++ k;
}
}
}
if(k > N / 2)
ans[n ++] = p;
for(i = 0; i < n; i ++)
{
for(j = 0, k = ans[i]; j < mid; j ++)
printf("%c", r[j + k]);
printf("\n");
}
}
void solve()
{
int i, j, k, mid, min, max;
da(M + 1, 300);
calheight(M);
min = 0, max = 1001;
for(;;)
{
mid = (max + min) / 2;
if(mid == min)
break;
if(check(mid))
min = mid;
else
max = mid;
}
if(mid == 0)
printf("?\n");
else
printresult(mid);
}
int main()
{
int t = 0;
for(;;)
{
scanf("%d", &N);
if(!N)
break;
init();
if(t ++)
printf("\n");
solve();
}
return 0;
}


posted on 2012-02-04 19:22  Staginner  阅读(278)  评论(0编辑  收藏  举报