后缀数组的一些技巧
}一般的,我们在字符串最后补个0,使排名从1开始。
后缀数组技巧:
①.对于可重复的最长重复子串问题,可以直接遍历height[1..n],易知排名相邻的字符串最相似。
②.对于不可重复的最长重复子串问题,可以二分答案,遍历height[1..n]分组:
每组大于mid,若碰到一个小于mid的更新。
判断这一组中的max(sa[i])-min(sa[i])是否大于等mid,
这意味着两个距离大于mid,且存在公共子串长于mid。重新开始一轮。
有希望成为最长公共前缀不小于 k 的两个后缀一定在同一组.所以可以nlogn求出。
③.对于求一个字符串子串的个数(两两不同),
可根据后缀数组的定义,求出以每个排名下标位置开头的数目:n-sa[i]-height[i];
所以若求子串排名,可以二分答案,找到相应位置,
若求出现的最前位置{
往后排名找,若有height>答案串长度,
可更新试探解,否则Break,这就必定有一个字符不等了
}(HDU5008)
④(个人理解):后缀数组的sa[i-1]的后缀和sa[i]的后缀在另外一种含义上是:最相似的子串,相邻两个串相似度不够,之后的就更不行了,这种思想可以用来解释技巧2中分组的原因。