跳蚤[BZOJ4310]

【题目描述】
很久很久以前,森林里住着一群跳蚤。一天,跳蚤国王得到了一个神秘的字符串,它想进行研究。首先,他会把串分成不超过 \(k\) 个子串,然后对于每个子串 \(S\),他会从\(S\)的所有子串中选择字典序最大的那一个,并在选出来的 \(k\) 个子串中选择字典序最大的那一个。他称其为“魔力串”。现在他想找一个最优的分法让“魔力串”字典序最小。

【输入格式】
第一行一个整数 k, \(k\leq 15\)
接下来一个长度不超过 \(10^5\) 的字符串 S。

【输出格式】
输出一行,表示字典序最小的“魔力串”。

题解

根据后缀数组height数组的定义,一个串s的本质不同的子串数目是\(\sum_{i=2}^{|s|} |s|-sa[i]+1-height[i]\)

可以二分答案\(mid\),即判定字典序排名为第\(mid\)的子串是否可以作为答案

如何找到排在第\(mid\)的子串是哪一个?有个显而易见的结论:排在第i的后缀的所有前缀的字典序一定比 排在第i+1的后缀的所有前缀的字典序小
所以得到一个这样的求法

inline pair<int, int> getrnk(ll r) {
	int i;
	for (i = 1; i <= n && r > n - sa[i] - height[i] + 1; i++) {
		r -= n - sa[i] - height[i] + 1;
	}
	return make_pair(sa[i], height[i] + r);
}

返回的是起始位置+子串长度 自行理解一下

然后其实二分判定是一个贪心的思想 从后往前扫 如果当前的这个后缀比二分的子串小了 就需要从上一位开始截掉 这个可以用LCP来快速判断

最后如果截断次数\(<k\),就是一个符合条件的子串

时间复杂度\(O(n\log n)\) (预处理ST表)

【代码】

#include <bits/stdc++.h>
#define N 100005
#define fi first
#define se second
using namespace std;
typedef long long ll;

char s[N];
int n, m, k, sa[N], sa2[N], rnk[N], key[N], sum[N], height[N];
int st[N<<1][21];

inline bool ok(int *num, int a, int b, int l) {
	return num[a] == num[b] && num[a+l] == num[b+l];
}

inline void suffix() {
	int i, j, p;
	for (i = 1; i <= m; i++) sum[i] = 0;
	for (i = 1; i <= n; i++) sum[rnk[i]=s[i]]++;
	for (i = 1; i <= m; i++) sum[i] += sum[i-1];
	for (i = n; i >= 1; i--) sa[sum[rnk[i]]--] = i;
	for (j = 1; j <= n; j <<= 1, m = p) {
		for (p = 0, i = n - j + 1; i <= n; i++) sa2[++p] = i;
		for (i = 1; i <= n; i++) if (sa[i] > j) sa2[++p] = sa[i] - j;
		for (i = 1; i <= n; i++) key[i] = rnk[sa2[i]];
		for (i = 1; i <= m; i++) sum[i] = 0;
		for (i = 1; i <= n; i++) sum[key[i]]++;
		for (i = 1; i <= m; i++) sum[i] += sum[i-1];
		for (i = n; i >= 1; i--) sa[sum[key[i]]--] = sa2[i];
		for (swap(sa2, rnk), i = 2, p = 2, rnk[sa[1]] = 1; i <= n; i++) {
			rnk[sa[i]] = ok(sa2, sa[i-1], sa[i], j) ? p-1 : p++;
		}
	}
}

inline void geth() {
	int p = 0;
	for (int i = 1; i <= n; i++) {
		int j = sa[rnk[i]-1];
		if (p) p--;
		while (s[i+p] == s[j+p]) p++;
		height[rnk[i]] = p;
	}
}

inline void init_st() {
	for (int i = 1; i <= n; i++) st[i][0] = height[i];
	for (int l = 1; l <= 20; l++) {
		for (int i = 1; i + (1 << l) - 1 <= n; i++) {
			st[i][l] = min(st[i][l-1], st[i+(1<<(l-1))][l-1]);
		}
	}
}

inline int LCP(int x, int y) {
	if (x == y) return n - x + 1;
	int l = rnk[x], r = rnk[y];
	if (l > r) swap(l, r); 
	l++;
	int len = log2(r - l + 1);
	return min(st[l][len], st[r-(1<<len)+1][len]);
}

inline pair<int, int> getrnk(ll r) {
	int i;
	for (i = 1; i <= n && r > n - sa[i] - height[i] + 1; i++) {
		r -= n - sa[i] - height[i] + 1;
	}
	return make_pair(sa[i], height[i] + r);
}

inline bool cmp(pair<int, int> a, pair<int, int> b) {
	int lcp = LCP(a.fi, b.fi);
	if (lcp >= a.se || lcp >= b.se) {
		return a.se <= b.se;
	} else return s[a.fi + lcp] < s[b.fi + lcp];
}

inline bool check(ll mid) {
	pair<int, int> a = getrnk(mid);
	int cnt = 0;
	for (int i = n, lst = n; i >= 1; i--) {
		if (s[a.fi] < s[i]) {
			return false;
		}
		if (!cmp(make_pair(i, lst - i + 1), a)) {
			cnt++, lst = i;
		}
		if (cnt >= k) {
			return false;
		}
	}
	return true;
}

int main() {
	scanf("%d%s", &k, s+1); n = strlen(s+1); m = 128; 
	suffix(); geth();
	ll tot = 0;
	for (int i = 1; i <= n; i++) tot += n - sa[i] + 1 - height[i];
	init_st();
	ll l = 1, r = tot, mid, ans = tot;
	while (l <= r) {
		mid = (l + r) >> 1;
		if (check(mid)) {
			ans = mid; r = mid - 1;
		} else l = mid + 1;
	}
	pair<int, int> aa = getrnk(ans);
	for (int i = aa.fi; i <= aa.fi + aa.se - 1; i++) {
		putchar(s[i]);
	}
	return 0;
}
posted @ 2020-02-05 19:43  AK_DREAM  阅读(122)  评论(0编辑  收藏  举报