「Day 11 & 12 & 13 & 14—杂项」

字符串Hash

定义

就是类似于 map 的一种映射关系吧,一个字符串对应一个整数值,通过整数值的异同来判断字符串的异同。那么如何去计算呢?

P3370 【模板】字符串哈希

单哈希法

我们可以对于一个字符串(s=s1,s2,s3,,sn),我们让 hash[i]=hash[i1]p+int(s[i]),这样就可以计算出一个在(264)次方内,也就是 unsigned long long 的范围内没什么问题。但是,万一这个  hash[i]  溢出了怎么办呢?我们可以通过模上一个数来解决。

hash[i]=(hash[i1]p+int(s[i]))%mod

注:这里的 pmod 都是一个质数,且 p < mod,但是我们要选一个较大的质数。

代码

点击查看代码
#include<iostream>
#include<algorithm>
using namespace std;

#define int unsigned long long

int n;
int tot = 0;
int a[10005];
int mod = 212370440130137957ll;
int p = 157;

int hx(string x){
	int len = x.size();
	int ans = 0;
	for(int i = 0;i < len;i ++){
		ans = (ans * p + (int)x[i]) % mod;
	}
	return ans;
}

signed main(){
	cin >> n;
	while(n --){
		string s;
		cin >> s;
		a[++ tot] = hx(s);
	}
	sort(a + 1,a + tot + 1);
	int sum = 0;
	for(int i = 1;i <= tot;i ++){
		if(a[i] != a[i + 1]){
			sum ++;
		}
	}
	cout << sum << "\n";
	return 0;
}

然鹅,这样对于一下的字符串,可能会爆:

S1 = abbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
S2 = bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb

那么我们就有可能会发生哈希冲突,即两个不同字符串的 Hash 值一样。

双哈希法

如果算一次容易发生哈希冲突,那么我要算两次阁下该如何应对呢?
这样一来哈希冲突的概率大大降低(狂喜)

我们可以用一个 pair<hash1,hash2> 来存储两个哈希的值,这样可以最大程度的减少哈希冲突。

代码

点击查看代码
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;

#define int unsigned long long

int n;
int mod1 = 212370440130137957ll;
int p1 = 157;
int mod2 = 192608173749137ll;
int p2 = 233;
vector<pair<int,int> > a;

pair<int,int> hx(string x){
	int len = x.size();
	int h1 = 0;
	int h2 = 0;
	for(int i = 0;i < len;i ++){
		h1 = (h1 * p1 + (int)x[i]) % mod1;
		h2 = (h2 * p2 + (int)x[i]) % mod2;
	}
	return make_pair(h1,h2);
}

signed main(){
	cin >> n;
	while(n --){
		string s;
		cin >> s;
		a.push_back(hx(s));
	}
	sort(a.begin(),a.end());
	int sum = 1;
	for(int i = 1;i < a.size();i ++){
		if(a[i] != a[i - 1]){
			sum ++;
		}
	}
	cout << sum << "\n";
	return 0;
}

子串哈希值

int geth(int l,int r) return h[r] - h[l - 1] * p[r - l + 1];

数学

P1226 【模板】快速幂

本质上是一种倍增的思想。

int qpow(int a,int b,int m){
    int ans = 1;
    a %= m;//防止溢出
    while(b){
	//b & 1的意思是b的最后一位,如果是1的话,就需要乘,不是则跳过
        if(b & 1) ans = (ans * a) % m;
	//把b左移一位,将最后一位删掉
        b >>= 1;
	//每次a倍增
        a = (a * a) % m;
    }
    return ans;
}
posted @   To_Carpe_Diem  阅读(20)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示