回文树总结

最近学习了回文树,这个比较新颖的数据结构,相应的写了12道关于回文树的题目。所以总结一下。

网络上关于回文树的学习的博客有很多质量很好的,这里就不具体分析回文树的构成了,但是我想把自己对回文树的理解写一下。


首先回文树是两个树,每个节点都是一个回文串。先说节点吧,节点是一个回文子串,但是不记录整个回文子串,而是记录回文串的长度,和两个指针

next指针,和fail指针。这是最基础的,当然我们可以在节点上再增加别的信息。

 next指针一个二维数组,next [ i ] [ j ] ,指向的是第i个节点在两端加上 j 对应的字符形成的回文串节点。next指针也是回文树主要支架,回文树是两棵树。每棵树节点之间都是next指针连接起来,这个和字典树相似。那么fail指针,是一个数组,指向的是该节点回文串中的最长后缀回文串的节点,fail指针式连接两棵树的边,相当于两棵树之间有很多边相互连接,同一棵树上也是有fail将两个节点连接起来的。

下图实线就是next指针,虚线是fail指针




一直说回文树是两棵树,两棵树的区别是,一棵树的节点是长度为偶数的回文串,另一棵树是长度为奇数的回文串。一开始会建立长度是0的节点和长度是-1的节点。长度为0就表示是偶回文串的树的根节点,而长度为-1就表示奇回文树的根节。


这是字符串aaba形成的回文树,aaba中包含四种回文串,a,b,aba,是长度为奇数的回文串,aa,是长度为偶数的回文串,a是aa的最长后缀回文子串,也是aba的最长后缀回文子串。实线是形成两棵树的基础,而虚线则是穿插在两棵树之间的桥梁


下面给出回文树的模板,再具体分析:

struct Tree
{
    int next[MAX+5][26];//next指针
    int num[MAX+5];//当前节点表示回文串中的后缀子回文串的数目
    int cnt[MAX+5];//当前节点表示回文串的个数
    int fail[MAX+5];//fail指针
    int len[MAX+5];//当前节点表示回文串的长度
    int s[MAX+5];//储存字符串
    int p;//节点个数
    int last;//最后一个节点
    int n;//字符串长度
    int new_node(int x)
    {
        memset(next[p],0,sizeof(next[p]));
        cnt[p]=0;
        num[p]=0;
        len[p]=x;
        return p++;
    }
    void init()
    {
        p=0;
        new_node(0);
        new_node(-1);
        last=0;
        n=0;
        s[0]=-1;
        fail[0]=1;
    }
    int get_fail(int x)
    {
        while(s[n-len[x]-1]!=s[n])
            x=fail[x];
        return x;
    }
    int add(int x)
    {
        x-='a';
        s[++n]=x;
        int cur=get_fail(last);
        if(!(last=next[cur][x]))
        {
            int now=new_node(len[cur]+2);
            fail[now]=next[get_fail(fail[cur])][x];
            next[cur][x]=now;
            num[now]=num[fail[now]]+1;
            last=now;
            return 1;
        }
        cnt[last]++;
        return 0;
    }
    void count()
    {
        for(int i=p-1;i>=0;p++)
            cnt[fail[i]]+=cnt[i];
    }
}tree;

如何构造回文树就不赘述了。这里我们分析这种网络上大量普及的模板可以做到哪些功能?

1,字符串中本质不同的回文串的种数。

这里p就是节点个数,也代表不同回文串的种数,每个节点代表的回文串都是独一无二的。

2,字符串中每个本质不同的回文串的个数   即cnt数组。

3,字符串中以某个点为结束或者开始形成的回文串的个数。

4,字符串中回文串总数。

第三个功能,某个点为结束,是通过num数组实现的,每次插入一个字符的时候,要么形成新的回文串要么形成旧的回文串,总之,在插入的时候返回num[last]就可以了。如果以某个点为开始,把字符串倒着输入就可以了

第四个功能就是第一个和第二个结合起来,当然也可以通过第三个稍加计算也可以得出来。

这些是基本的功能,了解这些就可以做一些比较基础的回文串的题目。但是作为ACMer,我们不能止步于这么简单的内容!


下面给出一些比较难的情况:

1,字符串不是从左往右依次给你的,它是一个可以在两头加的不断延长的字符,可以在前面加,也可有在后面加。这个时候应该怎么处理?

首先s数组应该是可以从两边加的,所以s数组设成字符串长度的2倍,那么一开始我们是在中间的,由于要在两边加入字符串,所以我们应该设置两个last指针

表示左边最后一个节点,和右边最后一个节点。那么也要设置两个边界,字符串的边界,表示从中间,左边的字符串长度,右边的字符串长度。这样的话就可以在两边加上字符串。但是你会发现一个问题,当在左边加入一个字符的时候,有可能连着右边的最后一个字符形成一个整的的回文串,那么对于右边而言last就要变了,就要变成整的回文串,所以要进行特判!


2,如果可以删除字符串怎么办?字符串可以加入,也可以删除字符串,当然从结尾开始删

如果加入字符形成了一个新的节点,那么要把该节点删除,即p- -。同时这个字符也形成了指向自己的next指针要把next指针删掉。

如果没有形成新的节点,只需要n- - 就好了,


3,如果现在回文树不是对一个字符串操作,而是要你对两个字符串操作,应该怎么办?

建立两棵回文树?,但是如果要你比较两个字符串有多少公共的回文串子串,两棵树的节点一一比较吗?显然超时。所以在一棵树上进行操作。在插入第一个字符串的时候,我们不用担心,可是插入第二个字符串,肯定会被前面的字符干扰啊。这个时候我们有两种解决办法:

1,可以在两个字符串之间插入2个两个字符串都没有出现过的字符,这样插入第二个字符串的时候肯定不会和第一个字符串形成回文串。

2,插入完第二个字符串的时候,把

        last=0;
        s[0]=-1;
        fail[0]=1;
        n=0;

建立新的数组num,cnt 表示第二个字符串的相关信息。




    


     


posted @ 2016-06-02 16:46  Shendu.CC  阅读(134)  评论(0编辑  收藏  举报