【后缀数组】[NOI2016]优秀的拆分

题目描述

如果一个字符串可以被拆分为 AABB 的形式,其中 AB 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。

例如,对于字符串 aabaabaa,如果令 A=aabB=a,我们就找到了这个字符串拆分成 AABB 的一种方式。

一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。比如我们令 A=aB=baa,也可以用 AABB 表示出上述字符串;但是,字符串 abaabaa 就没有优秀的拆分。

现在给出一个长度为 n 的字符串 S,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。

以下事项需要注意:

  1. 出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。
  2. 在一个拆分中,允许出现 A=B。例如 cccc 存在拆分 A=B=c
  3. 字符串本身也是它的一个子串。

输入格式

每个输入文件包含多组数据。输入文件的第一行只有一个整数 T,表示数据的组数。保证 1T10

接下来 T 行,每行包含一个仅由英文小写字母构成的字符串 S,意义如题所述。

输出格式

输出 T 行,每行包含一个整数,表示字符串 S 所有子串的所有拆分中,总共有多少个是优秀的拆分。

样例一

input

4
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba

output

3
5
4
7

explanation

我们用 S[i,j] 表示字符串 SSi 个字符到第 j 个字符的子串(从 1 开始计数)。

第一组数据中,共有 3 个子串存在优秀的拆分:

S[1,4]=aabb,优秀的拆分为 A=aB=b

S[3,6]=bbbb,优秀的拆分为 A=bB=b

S[1,6] = \mathtt{aabbbb}S[1,6]=aabbbb,优秀的拆分为 A= \mathtt{a}A=aB = \mathtt{bb}B=bb

而剩下的子串不存在优秀的拆分,所以第一组数据的答案是 33

第二组数据中,有两类,总共 44 个子串存在优秀的拆分:

对于子串 S[1,4] = S[2,5] = S[3,6] = \mathrm{cccc}S[1,4]=S[2,5]=S[3,6]=cccc,它们优秀的拆分相同,均为 A = \mathrm{c}A=cB = \mathrm{c}B=c,但由于这些子串位置不同,因此要计算 3 次;

对于子串 S[1,6]=cccccc,它优秀的拆分有 2 种:A=cB=ccA=ccB=c,它们是相同子串的不同拆分,也都要计入答案。

所以第二组数据的答案是 3+2=5

第三组数据中,S[1,8]S[4,11] 各有 2 种优秀的拆分,其中 S[1,8] 是问题描述中的例子,所以答案是 2+2=4

第四组数据中,S[1,4]S[6,11]S[7,12]S[2,11]S[1,8] 各有 1 种优秀的拆分,S[3,14]2 种优秀的拆分,所以答案是 5+2=7

样例二

见样例数据下载。

样例三

见样例数据下载。

限制与约定

对于全部的测试点,保证 1T10。以下对数据的限制均是对于单组输入数据而言的,也就是说同一个测试点下的 T 组数据均满足限制条件。

我们假定 n 为字符串 S 的长度,每个测试点的详细数据范围见下表:

测试点编号 n 其他约束
1、2300S中所有字符全部相同
3、42000
5、6\leq 1010
7、8\leq 2020
9、10\leq 3030
11、12\leq 5050
13、14\leq 100100
15200
16300
17500
181000
192000
2030000

时间限制:1.5s

空间限制:512MB

下载

样例数据下载



分析

CCF送80分,然后剩下的各种算法只相差5分。
直接来看满分算法。

我们将AABB分开看,计算一个字符开始有多少个AA。考场上我SB了,考完才想到可以像【后缀数组】[UVA10829]L-Gap substring 那样做。
枚举A的长度l,然后把整个字符串按照长度l分段,计算sils(i+1)lLCPLCS,如果长度加起来l,就说明这里有AA,在相应位置计数器增加1,即cntilLCS+1,cntilLCS+1cntilLCS+1+(LCS+LCP1l)都增加1。
然后再做一遍,这次不增加计数器了,增加可能的末尾位置的计数器的和,即ans+=(i+1)l+LCP1j=(i+1)l+LCP1(LCS+LCPl)cntj

代码

#include<cstdio>
#include<algorithm>
#include<cstring>
#define MAXN 300000
#define MAXLOG 19
#define MAXC 256
using namespace std;
template<class T>
void Read(T &x){
    static char c;
    bool f(0);
    while(c=getchar(),c!=EOF){
        if(c=='-')
            f=1;
        if(c>='0'&&c<='9'){
            x=c-'0';
            while(c=getchar(),c>='0'&&c<='9')
                x=x*10+c-'0';
            ungetc(c,stdin);
            if(f)
                x=-x;
            return;
        }
    }
}
int T,n,array[4][MAXN*2+10],*sa,*nsa,*rk,*nrk,b[MAXN*2+10],hn,m,st[MAXN*2+10][MAXLOG+1],height[MAXN*2+10],Log,cnt[MAXN+10],lg2[MAXN*2+10];
char s[MAXN+10];
long long ans;
void Get_sa(){
    int i,k;
    sa=array[0],nsa=array[1],rk=array[2],nrk=array[3];
    rk[n]=nrk[n]=-1;
    for(i=0;i<=MAXC;i++)
        b[i]=0;
    for(i=0;i<n;i++)
        b[s[i]]++;
    for(i=1;i<=MAXC;i++)
        b[i]+=b[i-1];
    for(i=0;i<n;i++)
        sa[--b[s[i]]]=i;
    for(rk[sa[0]]=0,i=1;i<n;i++){
        rk[sa[i]]=rk[sa[i-1]];
        if(s[sa[i]]!=s[sa[i-1]])
            rk[sa[i]]++;
    }
    for(k=1;rk[sa[n-1]]<n-1;k<<=1){
        for(i=0;i<n;i++)
            b[rk[sa[i]]]=i;
        for(i=n-1;i>=0;i--)
            if(sa[i]>=k)
                nsa[b[rk[sa[i]-k]]--]=sa[i]-k;
        for(i=n-k;i<n;i++)
            nsa[b[rk[i]]--]=i;
        for(nrk[nsa[0]]=0,i=1;i<n;i++){
            nrk[nsa[i]]=nrk[nsa[i-1]];
            if(rk[nsa[i-1]]!=rk[nsa[i]]||rk[nsa[i-1]+k]!=rk[nsa[i]+k])
                nrk[nsa[i]]++;
        }
        swap(rk,nrk);
        swap(sa,nsa);
    }
}
void Get_height(){
    int i,j,k=0;
    for(i=0;i<n;i++){
        if(!rk[i])
            height[rk[i]]=0;
        else{
            if(k)
                k--;
            for(j=sa[rk[i]-1];s[i+k]==s[j+k];k++);
            height[rk[i]]=k;
        }
    }
}
void read(){
    scanf("%s",s);
    n=strlen(s);
    int i;
    s[n]='$';
    for(i=1;i<=n;i++)
        s[n+i]=s[n-i];
    hn=n,n=n*2+1;
    for(Log=1;(1<<Log)<=n;Log++);
    Log--;
    s[n]=0;
}
void prepare_st(){
    int i,j;
    for(i=0;i<n;i++)
        *st[i]=height[i];
    for(j=1;j<=Log;j++)
        for(i=0;i<n;i++)
            if(i+(1<<j)<=n)
                st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
int Get_st(int i,int j){
    if(i>j)
        swap(i,j);
    int t=lg2[j-i];
    return min(st[i+1][t],st[j-(1<<t)+1][t]);
}
void solve(){
    int i,t,t1,j;
    for(i=1;i<=hn;i++){
        for(j=0;j+i<hn;j+=i){
            t=min(Get_st(rk[j+1],rk[j+i+1]),i-1);
            t+=t1=min(Get_st(rk[n-j-i-1],rk[n-j-1]),i);
            if(t>=i){
                cnt[j-t1+1]++;
                cnt[j-t1+1+t-i+1]--;
            }
        }
    }
    for(i=1;i<hn;i++)
        cnt[i]+=cnt[i-1];
    cnt[hn]=0;
    for(i=1;i<=hn;i++)
        cnt[i]+=cnt[i-1];
    for(i=1;i<=hn;i++){
        for(j=0;j+i<hn;j+=i){
            t=min(Get_st(rk[n-j-i-1],rk[n-j-1]),i);
            t+=t1=min(Get_st(rk[j+1],rk[j+i+1]),i-1);
            if(t>=i)
                ans+=cnt[j+i+t1+1]-cnt[j+i+t1+1-(t-i+1)];
        }
    }
}
void prepare(){
    for(int i=2;i<=(MAXN<<1);i++)
        lg2[i]=lg2[i>>1]+1;
}
int main()
{
    prepare();
    Read(T);
    while(T--){
        memset(cnt,0,sizeof cnt);
        ans=0;
        read();
        Get_sa();
        Get_height();
        prepare_st();
        solve();
        printf("%lld\n",ans);
    }
}
posted @ 2016-07-31 17:06  outer_form  阅读(189)  评论(0编辑  收藏  举报