「Day 11 & 12 & 13 & 14—杂项」
字符串Hash
定义
就是类似于 \(\text{map}\) 的一种映射关系吧,一个字符串对应一个整数值,通过整数值的异同来判断字符串的异同。那么如何去计算呢?
P3370 【模板】字符串哈希
单哈希法
我们可以对于一个字符串$ ( s = s_1, s_2, s_3, \ldots, s_n )$,我们让 \(\text{hash}[i] = \text{hash}[i - 1] \cdot p + \text{int}(s[i])\),这样就可以计算出一个在$ ( 2^{64} ) $次方内,也就是 unsigned long long
的范围内没什么问题。但是,万一这个 $ \ \text{hash}[i] \ $ 溢出了怎么办呢?我们可以通过模上一个数来解决。
\[\text{hash}[i] = (\text{hash}[i - 1] \cdot p + \text{int}(s[i])) \% \text{mod}
\]
注:这里的 \(\text{p}\) 和 \(\text{mod}\) 都是一个质数,且 \(\text{p < mod}\),但是我们要选一个较大的质数。
代码
点击查看代码
#include<iostream>
#include<algorithm>
using namespace std;
#define int unsigned long long
int n;
int tot = 0;
int a[10005];
int mod = 212370440130137957ll;
int p = 157;
int hx(string x){
int len = x.size();
int ans = 0;
for(int i = 0;i < len;i ++){
ans = (ans * p + (int)x[i]) % mod;
}
return ans;
}
signed main(){
cin >> n;
while(n --){
string s;
cin >> s;
a[++ tot] = hx(s);
}
sort(a + 1,a + tot + 1);
int sum = 0;
for(int i = 1;i <= tot;i ++){
if(a[i] != a[i + 1]){
sum ++;
}
}
cout << sum << "\n";
return 0;
}
然鹅,这样对于一下的字符串,可能会爆:
\(\text{S1 = abbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb}\)
\(\text{S2 = bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb}\)
那么我们就有可能会发生哈希冲突,即两个不同字符串的 \(\text{Hash}\) 值一样。
双哈希法
如果算一次容易发生哈希冲突,那么我要算两次阁下该如何应对呢?
这样一来哈希冲突的概率大大降低(狂喜)。
我们可以用一个 \(\text{pair<hash1,hash2>}\) 来存储两个哈希的值,这样可以最大程度的减少哈希冲突。
代码
点击查看代码
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;
#define int unsigned long long
int n;
int mod1 = 212370440130137957ll;
int p1 = 157;
int mod2 = 192608173749137ll;
int p2 = 233;
vector<pair<int,int> > a;
pair<int,int> hx(string x){
int len = x.size();
int h1 = 0;
int h2 = 0;
for(int i = 0;i < len;i ++){
h1 = (h1 * p1 + (int)x[i]) % mod1;
h2 = (h2 * p2 + (int)x[i]) % mod2;
}
return make_pair(h1,h2);
}
signed main(){
cin >> n;
while(n --){
string s;
cin >> s;
a.push_back(hx(s));
}
sort(a.begin(),a.end());
int sum = 1;
for(int i = 1;i < a.size();i ++){
if(a[i] != a[i - 1]){
sum ++;
}
}
cout << sum << "\n";
return 0;
}
子串哈希值
int geth(int l,int r) return h[r] - h[l - 1] * p[r - l + 1];
数学
P1226 【模板】快速幂
本质上是一种倍增的思想。
int qpow(int a,int b,int m){
int ans = 1;
a %= m;//防止溢出
while(b){
//b & 1的意思是b的最后一位,如果是1的话,就需要乘,不是则跳过
if(b & 1) ans = (ans * a) % m;
//把b左移一位,将最后一位删掉
b >>= 1;
//每次a倍增
a = (a * a) % m;
}
return ans;
}
本文来自一名初中牲,作者:To_Carpe_Diem