「总结」后缀2

1.喵星球的点名
发现这种多串匹配不用广义后缀自动机而用后缀数组就是chishi。
所以当然是大力广义后缀自动机了。
我们找到每个模式串的节点，并将之所有父链节点的大小全部加一来方便查询。
匹配的时候直接输出匹配的末尾节点的大小，并且将之的标记+1。
最后再次扫一次父链节点，把标记全部统计出来即可。
复杂度是：$O(n^{1.5})$，由于暴跳父亲。
但是这样的上界远远达不到。
甚至比后缀数组的大常数log跑的还快的多得多。

2.字符串
仍然后缀自动机暴力水过。
先翻转串。
首先对于每个节点线段树合并求出$endpos$集合。
考虑二分答案。
然后从前缀节点跳father跳到合适的$len$处。
这个过程可以直接用倍增来实现。
然后直接判断这个节点的$endpos$集合中是否含有$[a,b]$之间的元素就可以了。

3.yww 与字符串
这个题意思就是带限制的本质不同子串数目。
我们对于每个节点都维护一个$w$值代表他所能向左延伸的最长长度。
那么每个节点对本质不同子串的贡献就是：$$max(min(len[x],w[x])-len[fa[x]],0)$$
$mx$维护的时候要取$max$，因为一定是取长度最长的那一个，也是由于所有本质相同的子串只要有一个是"好"的,那么就可以计算贡献。

4.外星联络
水的很，直接建后缀树然后暴力dfs一次输出即可。

5.跳蚤
挺难的题。
而且只能用后缀数组来做。
首先二分答案在所有本质不同子串的排名。
考虑如何check。
我们从字符串的末尾开始一个一个的向前加入字符，如果当前的字符串排名已经大于当前二分串的排名，那么此时必须切一刀。
最后只需要判断切的次数和$K$的关系就可以调整二分上下界了。
考虑为什么是对的。
假设我们是从前往后加入字符的话，需要判断的是$[l,i],[l+1,i]……,[i,i]$这些字符串中最大的一个是否排名大于二分的答案。
不是很好判断。
而我们如果从后向前加入字符的话，需要判断的是$[i,r],[i,r-1],……,[i,i]$这些字符串中字典序最大的显然是$[i,r]$，只需要处理这一个串的大小即可。
假设已经的到了排名。
首先考虑如何由排名得到答案。
我们对于每个后缀按位置处理出这样一个数组:$ra[i]$，含义是$suffix(i)$在所有本质不同子串中的排名。
这样的话得到转移方程：

\[ra[sa[i]]=ra[sa[i-1]]+(n-sa[i]+1)-height[i] \]

也就是说除了$lcp$的部分，每一个位置都会产生一个本质不同子串。
这样我们完全可以线性的按照$rk$枚举后缀来求出$ra$数组。
求出后再次线性枚举，得到第一个使得$ra[sa[i]]>=K$的排名为$i$的后缀。
那么就很简单了，串的起点就是$sa[i]$了，那末尾就是$n+K-ra[sa[i]]$也就是串$s[sa[i],n+K-ra[sa[i]]]$
那么考虑对于给定的$s[l,r]$如何求出其排名。
首先找到这个串第一次（按rk来说的第一次）出现的后缀是哪个。
这个很简单，直接二分$[1,rk[l]]$的所有后缀即可，因为要得$rk$到尽量靠前并且$lcp(sa[mid],l)>=len$的后缀，所以具有单调性。
如果找到了这个位置就好说了，设这个后缀为$suffix(sa[x])$。
这个子串的本质不同排名就是$ra[sa[x]]-(n-sa[x]+1-len)$
这个就是$wzz$学长说的唯一的后缀数组可以办但是后缀自动机做不了的了。
对于模式串的任意排名，$logn$的求出串的位置。
对于任意的模式串子串，$logn$的求出串的排名。

6.股市的预测
仍然用后缀数组来做。
其实差分之后就是在找$ABA$形式的本质不同子串。
考虑枚举$A$的长度。
这样暴力来做的话复杂度是$n^2lnn$的。
但是我们考虑另外一种方法。
将模式串每$A$个分一块。
然后对于每块的起点$i$求出他和另一个位置$i+A+m$的最长前后缀长度，然后由于可以平移。
那么设$lcp+lcs=w$，那么这一块作出的贡献就是：$w-A$
这样复杂度是：

\[\sum\limits_{i=1}^{n}\frac{n}{i}=nln n \]

posted @ 2019-12-25 14:43 Lrefrain 阅读(193) 评论(0) 收藏举报

刷新页面返回顶部

$Lrefrain$

百折不挠。

「总结」后缀2

公告