[模板]后缀自动机

原理

给自动机上的每个点定义两种属性:[min,max]和right集合,这个点表示(长度在[min,max]的、所有出现位置的右端点的集合为right的子串)

然后可以证明,两个节点的right集合要么不相交,要么互相包含

于是,让right直接包含(某个点的right)的点作为它的父亲,可以得到一个parent树

再开一个root点,如果某个点没有被别的点包含,那就把它指向root

所以就可以只用len(最大长度)和fa(parent树中的父亲)表示某个点

如果有(在某点p所表示的某一子串后面加上字符x能被点q表示),那么有转移p-x->q

于是点数和边数都是O(n)的,不会证。

做法

考虑在线构造,每次加入一个新字符,设它是x

记一下上次插的点lst,设增加一个新点p,让他能表示目前的整个字符串

那么首先有len[p]=len[lst]+1(lst能表示插x前的字符串嘛)

考虑lst和它的祖先们,把它们按len从大到小排序,可以发现[有x的转移]是单调的,就是说前面一些都没有,后面一些都有

那我那些没有x转移的点就可以直接加上一个转移x到p

然后考虑第一个有x转移的点o,设他转移到的点是q

由于len[p]肯定是比len[q]大的,所以我想试着由p向q连parent边

然而你直接连的话会发现len可能有些不合要求(考虑aabab,直接把5塞进原来表示aab的right集合(原来是{3})里会导致len变小,aab就表示不了了)

那么要分两种情况:len[q]==len[o]+1?

如果相等的话就没有以上的问题,直接连即可

如果不相等,那我新开一个点nq强行让他相等

nq的父亲和转移和q都是一样的,但是len会变成len[o]+1

当然原来的q还要保留,并且让nq作为q的父亲,这时就可以让nq作为p的父亲了

然后还有原来能转移到q的那些lst的祖先,现在都要改成转移到nq(可以发现这些祖先在刚才排序完以后也是连续的一段)

另外,如果根本没有有转移x的祖先,那直接让p连向root就可以了

均摊下来总复杂度大概是O(n)的

 1 inline int insert(int x,int o){
 2     int p=++pct;
 3     len[p]=len[o]+1;
 4     for(;o&&!tr[o][x];o=fa[o]) tr[o][x]=p;
 5     if(!o){fa[p]=rt;return p;}
 6     int q=tr[o][x];
 7     if(len[q]==len[o]+1){fa[p]=q;return p;}
 8     int nq=++pct;
 9     fa[nq]=fa[q],memcpy(tr[nq],tr[q],sizeof(tr[q]));
10     fa[q]=fa[p]=nq;len[nq]=len[o]+1;
11     for(;o&&tr[o][x]==q;o=fa[o]) tr[o][x]=nq;
12     return p;
13 }

例题

以后再补吧

posted @ 2019-04-26 13:48  Ressed  阅读(187)  评论(0编辑  收藏  举报