算法
顾名思义,就是将后缀按照字典序排序。
考虑倍增的思路,先按长度为排序,推出长度为的排序,只需要合并两个长度为的字符串。
记表示开始往后长度为当前的后缀排名,为排第的下标。
合并相当于先按后个排序(已经得到了),然后再按前排序,排名相同不改变按后个排序的顺序。
代码如下:
点击查看代码
void _sort() {
for(int i = 1; i <= m; i++) c[i] = 0;
for(int i = 1; i <= n; i++) c[rk[i]]++;
for(int i = 1; i <= m; i++) c[i] += c[i-1];
for(int i = n; i >= 1; i--) SA[c[rk[y[i]]]--] = y[i];
}
void _SAS() {
for(int i = 1; i <= n; i++) rk[i] = s[i], y[i]=i;
_sort();
for(int k = 1; k < n; k <<= 1) {
int cc = 0;
for(int i = n - k + 1; i <= n; i++)y[++cc] = i;
for(int i = 1; i <= n; i++)if(SA[i] > k)y[++cc]= SA[i] - k;
_sort(); swap(tmp, rk); cc = 1; rk[SA[1]] = 1;
for(int i = 2; i <= n; i++) rk[SA[i]] = (tmp[SA[i]] == tmp[SA[i-1]] && tmp[SA[i] + k] == tmp[SA[i-1] + k]) ? cc:++cc;
m = cc;
}
for(int i = 1; i <= n; i++) printf("%d ", SA[i]); puts("");
}
LCP相关(Height数组)
:
性质:(后面补证明):
因此直接从开始暴力判断。
code:
点击查看代码
for(int i = 1, j; i <= n; i++) {
if(rk[i] == 1) continue;
for(H[i] = max(0, H[i - 1] - 1), j = SA[rk[i] - 1]; s[i + H[i]] == s[j + H[i]]; H[i]++);
ht[rk[i]] = H[i];
}
求两后缀LCP
找到它们在中的位置,求之间的最小值。ST预处理一下即可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)