[模板]后缀自动机
原理
给自动机上的每个点定义两种属性:[min,max]和right集合,这个点表示(长度在[min,max]的、所有出现位置的右端点的集合为right的子串)
然后可以证明,两个节点的right集合要么不相交,要么互相包含
于是,让right直接包含(某个点的right)的点作为它的父亲,可以得到一个parent树
再开一个root点,如果某个点没有被别的点包含,那就把它指向root
所以就可以只用len(最大长度)和fa(parent树中的父亲)表示某个点
如果有(在某点p所表示的某一子串后面加上字符x能被点q表示),那么有转移p-x->q
于是点数和边数都是O(n)的,不会证。
做法
考虑在线构造,每次加入一个新字符,设它是x
记一下上次插的点lst,设增加一个新点p,让他能表示目前的整个字符串
那么首先有len[p]=len[lst]+1(lst能表示插x前的字符串嘛)
考虑lst和它的祖先们,把它们按len从大到小排序,可以发现[有x的转移]是单调的,就是说前面一些都没有,后面一些都有
那我那些没有x转移的点就可以直接加上一个转移x到p
然后考虑第一个有x转移的点o,设他转移到的点是q
由于len[p]肯定是比len[q]大的,所以我想试着由p向q连parent边
然而你直接连的话会发现len可能有些不合要求(考虑aabab,直接把5塞进原来表示aab的right集合(原来是{3})里会导致len变小,aab就表示不了了)
那么要分两种情况:len[q]==len[o]+1?
如果相等的话就没有以上的问题,直接连即可
如果不相等,那我新开一个点nq强行让他相等
nq的父亲和转移和q都是一样的,但是len会变成len[o]+1
当然原来的q还要保留,并且让nq作为q的父亲,这时就可以让nq作为p的父亲了
然后还有原来能转移到q的那些lst的祖先,现在都要改成转移到nq(可以发现这些祖先在刚才排序完以后也是连续的一段)
另外,如果根本没有有转移x的祖先,那直接让p连向root就可以了
均摊下来总复杂度大概是O(n)的
1 inline int insert(int x,int o){ 2 int p=++pct; 3 len[p]=len[o]+1; 4 for(;o&&!tr[o][x];o=fa[o]) tr[o][x]=p; 5 if(!o){fa[p]=rt;return p;} 6 int q=tr[o][x]; 7 if(len[q]==len[o]+1){fa[p]=q;return p;} 8 int nq=++pct; 9 fa[nq]=fa[q],memcpy(tr[nq],tr[q],sizeof(tr[q])); 10 fa[q]=fa[p]=nq;len[nq]=len[o]+1; 11 for(;o&&tr[o][x]==q;o=fa[o]) tr[o][x]=nq; 12 return p; 13 }
例题
以后再补吧