字符串哈希
题目描述
给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
算法 字符串hash
核心思想:将字符串看成P进制数,P的经验值是131或13331,取这两个值的冲突概率低
小技巧:
由于前缀值的值会很大 取模的数用2^64,这样直接用unsigned long long存储,溢出的结果就是取模的结果,
取模2^64的这种题目。遇到这种限制条件时就要想到用unsigned long long类型。
可以简洁地声明为typedef unsigned long long ull。这样,如果ull类型的整数溢出了,就相当于取模264了。因为ull的范围是[0,264-1]。
c++ 代码
#include<iostream>
using namespace std;
const int N=100010,P=131;
typedef unsigned long long ull;
ull h[N],p[N];// h[k]存储字符串前k个字母的哈希值, p[k]存储第k位的权值 P^k mod 2^64
int n,m;
char s[N];
ull get(int l,int r)
{
return h[r]-h[l-1]*p[r-l+1];//相当于把1~l-1的所有位左移r-l+r,相减后就是l~r的hash值
}
int main()
{
cin>>n>>m>>s+1;
p[0]=1;
for(int i=1;i<=n;i++)
{
p[i]=p[i-1]*P;//预处理,把幂也预处理出来
h[i]=h[i-1]*P+s[i];//只要s[i]不等于0就行
}
while(m--)
{
int l1,r1,l2,r2;
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
if(get(l1,r1)==get(l2,r2)) puts("Yes");
else puts("No");
}
return 0;
}