2022-11-18 Acwing每日一题

本系列所有题目均为Acwing课的内容,发表博客既是为了学习总结,加深自己的印象,同时也是为了以后回过头来看时,不会感叹虚度光阴罢了,因此如果出现错误,欢迎大家能够指出错误,我会认真改正的。同时也希望文章能够让你有所收获,与君共勉!

字符串哈希

给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2,请你判断 [l1,r1][l2,r2] 这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式
第一行包含整数 n 和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No

每个结果占一行。

数据范围
1≤n,m≤105
输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

算法原理

字符串哈希,能够将不同的字符串映射到不同的数字,对形如 \(X_1X_2....X_n\) 的字符串,采用字符的ascii 码乘上 P 的次方,也就是使用P进制(P[0]=1别忘了,而且P进制数组是从1开始存储的,p[0]只是用来方便后面的前缀和能统一形式的)来计算哈希值。
映射公式\((X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ\),这样就能以字符串的哈希值来判断字符串相等啦,构造一个字符串哈希值的时间复杂度为\(O(n)+O(m)\),在较长字符串比较中比KMP匹配的\(O(n)\times O(m)\)要快多啦。
注意:

  1. 字符不能映射为0,0的p进制数依然是0
  2. 数学证明设置P为131质数就会减少哈希冲突的概率

那么怎么求一个子字符串的哈希值呢,已知h[l],h[r]怎么求他们之间子字符串的哈希值呢?
我们可以将R位的哈希值往左移(往左移要除的,因为这时前缀哈希,从左往右的P进制)即l往右移(这时候就要乘)\(h[l-1]\times{P^{r-l+1}}\),把他跟L位的哈希值对齐,就可以用相减就可以得到它们之间字符串的哈希值了.
前缀和\(h[i+1]=h[i]P+s[i]\),其中\(i\in{[0,n-1]}\)
区间和公式:\(h[l,r] = h[r]-h[l-1]\times{P^{r-l+1}}\)

代码实现

#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
typedef unsigned long long ULL;
const int  N = 1e5+5,P = 131 ;// 13331
ULL h[N],p[N];
char str[N];
int n,m;

ULL get(int l,int r){
	return h[r] - h[l-1]*p[r-l+1];
}

int main()
{
    scanf("%d%d",&n,&m);
    scanf("%s",str+1);
    p[0] = 1;
    for(int i=1; i<=n ; ++i){
		h[i] = h[i-1] + s[i];
		p[i] = p[i-1] * P;	// P进制的每一位的进位数
	};
	
    while(m--){
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(get(l1,r1) == get(l2,r2))    puts("Yes");
        else puts("No");
    }
    return 0;
}
posted @ 2022-11-18 22:43  ZmQmZa  阅读(18)  评论(0编辑  收藏  举报