「Day 11 & 12 & 13 & 14—杂项」

字符串Hash

定义

就是类似于 \(\text{map}\) 的一种映射关系吧,一个字符串对应一个整数值,通过整数值的异同来判断字符串的异同。那么如何去计算呢?

P3370 【模板】字符串哈希

单哈希法

我们可以对于一个字符串$ ( s = s_1, s_2, s_3, \ldots, s_n )$,我们让 \(\text{hash}[i] = \text{hash}[i - 1] \cdot p + \text{int}(s[i])\),这样就可以计算出一个在$ ( 2^{64} ) $次方内,也就是 unsigned long long 的范围内没什么问题。但是,万一这个 $ \ \text{hash}[i] \ $ 溢出了怎么办呢?我们可以通过模上一个数来解决。

\[\text{hash}[i] = (\text{hash}[i - 1] \cdot p + \text{int}(s[i])) \% \text{mod} \]

注:这里的 \(\text{p}\)\(\text{mod}\) 都是一个质数,且 \(\text{p < mod}\),但是我们要选一个较大的质数。

代码

点击查看代码
#include<iostream>
#include<algorithm>
using namespace std;

#define int unsigned long long

int n;
int tot = 0;
int a[10005];
int mod = 212370440130137957ll;
int p = 157;

int hx(string x){
	int len = x.size();
	int ans = 0;
	for(int i = 0;i < len;i ++){
		ans = (ans * p + (int)x[i]) % mod;
	}
	return ans;
}

signed main(){
	cin >> n;
	while(n --){
		string s;
		cin >> s;
		a[++ tot] = hx(s);
	}
	sort(a + 1,a + tot + 1);
	int sum = 0;
	for(int i = 1;i <= tot;i ++){
		if(a[i] != a[i + 1]){
			sum ++;
		}
	}
	cout << sum << "\n";
	return 0;
}

然鹅,这样对于一下的字符串,可能会爆:

\(\text{S1 = abbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb}\)
\(\text{S2 = bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb}\)

那么我们就有可能会发生哈希冲突,即两个不同字符串的 \(\text{Hash}\) 值一样。

双哈希法

如果算一次容易发生哈希冲突,那么我要算两次阁下该如何应对呢?
这样一来哈希冲突的概率大大降低(狂喜)

我们可以用一个 \(\text{pair<hash1,hash2>}\) 来存储两个哈希的值,这样可以最大程度的减少哈希冲突。

代码

点击查看代码
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;

#define int unsigned long long

int n;
int mod1 = 212370440130137957ll;
int p1 = 157;
int mod2 = 192608173749137ll;
int p2 = 233;
vector<pair<int,int> > a;

pair<int,int> hx(string x){
	int len = x.size();
	int h1 = 0;
	int h2 = 0;
	for(int i = 0;i < len;i ++){
		h1 = (h1 * p1 + (int)x[i]) % mod1;
		h2 = (h2 * p2 + (int)x[i]) % mod2;
	}
	return make_pair(h1,h2);
}

signed main(){
	cin >> n;
	while(n --){
		string s;
		cin >> s;
		a.push_back(hx(s));
	}
	sort(a.begin(),a.end());
	int sum = 1;
	for(int i = 1;i < a.size();i ++){
		if(a[i] != a[i - 1]){
			sum ++;
		}
	}
	cout << sum << "\n";
	return 0;
}

子串哈希值

int geth(int l,int r) return h[r] - h[l - 1] * p[r - l + 1];

数学

P1226 【模板】快速幂

本质上是一种倍增的思想。

int qpow(int a,int b,int m){
    int ans = 1;
    a %= m;//防止溢出
    while(b){
	//b & 1的意思是b的最后一位,如果是1的话,就需要乘,不是则跳过
        if(b & 1) ans = (ans * a) % m;
	//把b左移一位,将最后一位删掉
        b >>= 1;
	//每次a倍增
        a = (a * a) % m;
    }
    return ans;
}
posted @ 2024-08-17 09:28  To_Carpe_Diem  阅读(19)  评论(0编辑  收藏  举报