异或哈希
简介
我们知道哈希就是把一个字符串转化为一个数字。但普通的哈希是有顺序的,而如果我们想判断两个集合是否相同,就需要使用异或哈希了。
思路
异或哈希,就是把每一种值映射到某一个随机数上,再把它们异或起来。因为异或具有交换律,所以可以比较集合。
但我们怎么保证异或哈希的正确性呢?
假设我们随机的值域为 \([0,2^{64}-1]\),我们来分别考虑每一位;在每一位上,两个随机值相等的概率为 \(\frac{1}{2}\),因为总共有 \(4\) 种情况,而只有两种情况他们相等。所以 \(64\) 位都相等的概率为 \(2^{-64}\)。基本上 \(10^6\) 以内个数都是可以接受的。
代码
using ull = unsigned long long;
const int MAXN = 1000001;
int a[MAXN];
ull sum[MAXN];
mt19937_64 rnd(time(0));
map<int, ull> mp;
bool Equiv(int l, int r, int l2, int r2) {
return (sum[r] ^ sum[l - 1]) == (sum[r2] ^ sum[r2 - 1]);
}
for(int i = 1; i <= n; ++i) {
cin >> a[i];
if(!mp.count(a[i])) {
mp[a[i]] = rnd();
}
sum[i] = (sum[i - 1] ^ a[i]);
}