Processing math: 100%


UOJ#395. 【NOI2018】你的名字 字符串,SAM,线段树合并

原文链接https://www.cnblogs.com/zhouzhendong/p/UOJ395.html

题解

记得同步赛的时候这题我爆0了,最暴力的暴力都没调出来。

首先我们看看 68 分怎么做

——求两个串的本质不同的公共子串个数。

  它是一个模板题,然而我当时并不会,甚至连SAM都忘了怎么写QAQ。

 

再简化一下:如何求一个串的本质不同的子串个数。

  给串建一个SAM,把所有节点代表的字符串个数(也就是 Max(x) - Max(fa(x)) 加起来就好了。

 

回到上一个问题。

假设这两个串分别是 S,T 。对 T 建个SAM。

对于T的SAM,考虑对于它的任何一个节点 x ,算出 x 的 Right 集合代表的所有前缀与 S 的所有前缀的 LCS 的最大值(也就是这个节点代表的状态能在 S 上匹配的最长长度),设为 val(x)。然后对于所有 x 把 (1,val(x)](Max(fa(x)),Max(x)] 的长度加起来就好了。

那么如何求那个最长的匹配长度?对 S 建一个 SAM,然后用 T 在 S 的 SAM 上走一遍,找到 T 的每一个前缀的 最长的是 S 的子串的后缀  然后 T 的 SAM 上的一个节点的 val 就是他在 parent 树上的所有后代节点的 Max 。

由于 S 的 SAM 可以预先建好,所以询问一个 T 串的复杂度是 O(|T|) 的。

 

那么 S 有 [L,R] 的限制呢?

线段树合并预处理一下 S 的 SAM 的每一个节点的 Right 集合。

修改一下求最长的匹配长度的过程,保证走转移边的时候在 [L,R] 中有匹配。

注意这里有一个易错点:我们匹配失败跳 father 的时候,不能直接 len' = Max(father) ,只能不断减一。原因是在 len 不断减一的过程中可能会找到匹配,而直接跳 father 会漏过这个匹配。然而出题人数据出的很水,没注意到这个东西还是有96分!

 

至此,我们得到了一个 O((|S|+|T|)log|S|) 的做法。

 

 

但是,由于在 SAM 上遍历节点暴力跳祖先的复杂度是 O(nn) 的,然后加个线段树合并多个 log ,总复杂度 O(nnlogn) 的可以通过原题数据……wft??(UOJ Hack数据过不去的)

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
#include <bits/stdc++.h>
#define clr(x) memset(x,0,sizeof (x))
using namespace std;
typedef long long LL;
LL read(){
    LL x=0,f=0;
    char ch=getchar();
    while (!isdigit(ch))
        f|=ch=='-',ch=getchar();
    while (isdigit(ch))
        x=(x<<1)+(x<<3)+(ch^48),ch=getchar();
    return f?-x:x;
}
const int N=500005*4;
int n,m,q;
char s[N];
struct Node{
    int Next[26],fa,Max,pos;
};
namespace Seg{
    const int S=N*35;
    int ls[S],rs[S],cnt=0;
    void Ins(int &rt,int L,int R,int x){
        if (!rt)
            rt=++cnt;
        if (L==R)
            return;
        int mid=(L+R)>>1;
        if (x<=mid)
            Ins(ls[rt],L,mid,x);
        else
            Ins(rs[rt],mid+1,R,x);
    }
    int Merge(int a,int b,int L,int R){
        if (!a||!b)
            return a+b;
        int rt=++cnt;
        if (L<R){
            int mid=(L+R)>>1;
            ls[rt]=Merge(ls[a],ls[b],L,mid);
            rs[rt]=Merge(rs[a],rs[b],mid+1,R);
        }
        return rt;
    }
    int Query(int rt,int L,int R,int xL,int xR){
        if (!rt||R<xL||L>xR||xL>xR)
            return 0;
        if (xL<=L&&R<=xR)
            return 1;
        int mid=(L+R)>>1;
        return Query(ls[rt],L,mid,xL,xR)
              |Query(rs[rt],mid+1,R,xL,xR);
    }
}
namespace SAM{
    Node t[N];
    int root,last,size;
    int rt[N],id[N];
    void Init(){
        while (size){
            clr(t[size].Next);
            t[size].fa=t[size].Max=t[size].pos=rt[size]=0;
            size--;
        }
        root=last=size=1;
    }
    void extend(int c,int ps){
        int p=last,np=++size,q,nq;
        t[np].Max=t[p].Max+1,t[np].pos=ps;
        Seg::Ins(rt[np],1,n,ps);
        for (;p&&!t[p].Next[c];p=t[p].fa)
            t[p].Next[c]=np;
        if (!p)
            t[np].fa=1;
        else {
            q=t[p].Next[c];
            if (t[p].Max+1==t[q].Max)
                t[np].fa=q;
            else {
                nq=++size;
                t[nq]=t[q],t[nq].Max=t[p].Max+1,t[nq].pos=ps;
                t[np].fa=t[q].fa=nq;
                for (;p&&t[p].Next[c]==q;p=t[p].fa)
                    t[p].Next[c]=nq;
            }
        }
        last=np;
    }
    void Sort(){
        static int tax[N];
        for (int i=0;i<=size;i++)
            tax[i]=0;
        for (int i=1;i<=size;i++)
            tax[t[i].Max]++;
        for (int i=1;i<=size;i++)
            tax[i]+=tax[i-1];
        for (int i=1;i<=size;i++)
            id[tax[t[i].Max]--]=i;
    }
    void build(){
        Sort();
        for (int i=size;i>1;i--){
            int x=id[i],f=t[x].fa;
            rt[f]=Seg::Merge(rt[f],rt[x],1,n);
        }
    }
}
namespace sam{
    Node t[N];
    int root,last,size;
    int id[N],val[N];
    void Init(){
        while (size){
            clr(t[size].Next);
            t[size].fa=t[size].Max=t[size].pos=val[size]=0;
            size--;
        }
        root=last=size=1;
    }
    void extend(int c,int ps){
        int p=last,np=++size,q,nq;
        t[np].Max=t[p].Max+1,t[np].pos=ps;
        for (;p&&!t[p].Next[c];p=t[p].fa)
            t[p].Next[c]=np;
        if (!p)
            t[np].fa=1;
        else {
            q=t[p].Next[c];
            if (t[p].Max+1==t[q].Max)
                t[np].fa=q;
            else {
                nq=++size;
                t[nq]=t[q],t[nq].Max=t[p].Max+1,t[nq].pos=ps;
                t[np].fa=t[q].fa=nq;
                for (;p&&t[p].Next[c]==q;p=t[p].fa)
                    t[p].Next[c]=nq;
            }
        }
        last=np;
    }
    void Sort(){
        static int tax[N];
        for (int i=0;i<=size;i++)
            tax[i]=0;
        for (int i=1;i<=size;i++)
            tax[t[i].Max]++;
        for (int i=1;i<=size;i++)
            tax[i]+=tax[i-1];
        for (int i=1;i<=size;i++)
            id[tax[t[i].Max]--]=i;
    }
    LL solve(){
        Sort();
        LL ans=0;
        for (int i=size;i>1;i--){
            int x=id[i],f=t[x].fa;
            val[f]=max(val[x],val[f]);
            ans+=max(0,t[x].Max-max(t[f].Max,val[x]));
        }
        return ans;
    }
}
int main(){
    scanf("%s",s+1);
    n=strlen(s+1),q=read();
    SAM::Init();
    for (int i=1;i<=n;i++)
        SAM::extend(s[i]-'a',i);
    SAM::build();
    SAM::t[0].Max=-1;
    while (q--){
        scanf("%s",s+1);
        m=strlen(s+1);
        sam::Init();
        int L=read(),R=read();
        int x=1,len=0;
        for (int i=1;i<=m;i++){
            int c=s[i]-'a',nowx=sam::size+1;
            sam::extend(c,i);
            while (x){
                int nx=SAM::t[x].Next[c];
                if (nx&&Seg::Query(SAM::rt[nx],1,n,L+len,R))
                    break;
                if ((--len)==SAM::t[SAM::t[x].fa].Max)
                    x=SAM::t[x].fa;
            }
            if (!x)
                x=1,len=0;
            else {
                x=SAM::t[x].Next[c];
                sam::val[nowx]=++len;
            }
        }
        printf("%lld\n",sam::solve());
    }
    return 0;
}

  

posted @   zzd233  阅读(282)  评论(0编辑  收藏  举报
编辑推荐:
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
阅读排行:
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 本地部署DeepSeek后,没有好看的交互界面怎么行!
· DeepSeek 解答了困扰我五年的技术问题。时代确实变了!
· 趁着过年的时候手搓了一个低代码框架
· 推荐一个DeepSeek 大模型的免费 API 项目!兼容OpenAI接口!

点击右上角即可分享
微信分享提示