51 NOD 1753 相似子串 字符串hash
1735 相似子串
基准时间限制:5 秒 空间限制:131072 KB 分值: 80
两个字符串相似定义为:
1.两个字符串长度相等
2.两个字符串对应位置上有且仅有至多一个位置所对应的字符不相同
给定一个字符串,每次询问两个子串在给定的规则下是否相似。给定的规则指每次给出一些等价关系,如‘a'=’b',‘b'=’c'等,注意这里的等价关系具有传递性,即若‘a'=’b',‘b'=’c',则‘a'=’c'。
1.两个字符串长度相等
2.两个字符串对应位置上有且仅有至多一个位置所对应的字符不相同
给定一个字符串,每次询问两个子串在给定的规则下是否相似。给定的规则指每次给出一些等价关系,如‘a'=’b',‘b'=’c'等,注意这里的等价关系具有传递性,即若‘a'=’b',‘b'=’c',则‘a'=’c'。
Input
第一行一个字符串s(1<=|s|<=300000) 第二行一个整数T(1<=T<=300000) 对于每次询问: 第一行5个整数k,l1,r1,l2,r2,表示有k个等价规则,询问的是子串[l1,r1],[l2,r2](1<=k<=10,1<=l1<=r1<=|s|,1<=l2<=r2<=|s|) 接下来k行每行两个连续的字符表示这两个字符等价。 此题中所有的字符均为小写字母。
Output
T行,若相似则输出“YES”否则输出“NO”
Input示例
abac 3 1 1 2 3 4 bc 1 1 2 3 4 ac 1 1 2 2 3 ac
Output示例
YES YES NO
题解:
hash值是由一系列字符* base^i 组成的,这里首先按照字母归类(如“aba”,按“a”归类即为“a”*( base^1+base^3 ))
如果只是判断在给定规则下是否相等,那么可以把归类后26个字母对应的hash值按照并查集里的等价关系进行累加,
若某一联通块所对应的hash值的总和在两个串中不相等则两个串在给定规则下不相等,否则相等。
考虑只有一个位置不同的情况,那么必然是存在两个联通块对应的hash在两个串上不相等,且这两个差值是base的某个幂次的两个相反数,
那么预处理一下base所有次幂并存下即可。
时间复杂度O((|S|+T)*26)
#include <bits/stdc++.h> inline long long read(){long long x=0,f=1;char ch=getchar();while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getchar();}return x*f;} using namespace std; typedef unsigned long long ULL; const int N = 4e5+10; const ULL mod = 10000019ULL; ULL sqr[N], tmp = 1, pre[N][27], fi[50], se[50]; map<ULL, int> mp; char s[N], ch[50]; int T, fa[50], vis[50], F[50]; int finds(int x) {return fa[x] == x? x:fa[x]=finds(fa[x]);} int main() { scanf("%s%d",s+1,&T); int n = strlen(s+1); sqr[0] = 1; for(int i = 1; i <= n; ++i) sqr[i] = sqr[i-1] * mod, mp[sqr[i]] = 1,mp[(-sqr[i])] = 1; for(int i = 1; i <= n; ++i) { tmp = tmp * mod; pre[i][s[i] - 'a' + 1] += tmp; } for(int i = 1; i <= n; ++i) { for(int j = 1; j <= 26; ++j) pre[i][j] += pre[i-1][j]; } for(int t = 1; t <= T; t++) { int k,l1,r1,l2,r2,cnt = 0; scanf("%d%d%d%d%d",&k,&l1,&r1,&l2,&r2); for(int i = 1; i <= 26; ++i) fa[i] = i,vis[i] = 0; for(int i = 1; i <= 26; ++i) fi[i] = pre[r1][i] - pre[l1-1][i]; for(int i = 1; i <= 26; ++i) se[i] = pre[r2][i] - pre[l2-1][i]; for(int i = 1; i <= k; ++i) { scanf("%s",ch); int fx = finds(ch[0] - 'a' + 1); int fy = finds(ch[1] - 'a' + 1); if(fx > fy) swap(fx,fy); if(fx != fy) fa[fy] = fx,fi[fx] += fi[fy],se[fx] += se[fy],fi[fy] = 0,se[fy] = 0; } if(r1 - l1 != r2 - l2) { printf("NO\n"); continue; } for(int i = 1; i <= 26; ++i) { int nfa = finds(i); if(fi[nfa]*sqr[l2 - l1] != se[nfa] && !vis[nfa]) F[++cnt] = i, vis[nfa] = 1; } if(cnt == 0) printf("YES\n"); else { if(cnt > 2) printf("NO\n"); else { if(fi[F[1]]*sqr[l2 - l1] + fi[F[2]]*sqr[l2 - l1]== se[F[2]] + se[F[1]]) { if(mp[(fi[F[1]]*sqr[l2 - l1] - se[F[1]])])printf("YES\n"); else printf("NO\n"); } else printf("NO\n"); } } } return 0; }