异或哈希

简介

我们知道哈希就是把一个字符串转化为一个数字。但普通的哈希是有顺序的,而如果我们想判断两个集合是否相同,就需要使用异或哈希了。

思路

异或哈希,就是把每一种值映射到某一个随机数上,再把它们异或起来。因为异或具有交换律,所以可以比较集合。

但我们怎么保证异或哈希的正确性呢?

假设我们随机的值域为 \([0,2^{64}-1]\),我们来分别考虑每一位;在每一位上,两个随机值相等的概率为 \(\frac{1}{2}\),因为总共有 \(4\) 种情况,而只有两种情况他们相等。所以 \(64\) 位都相等的概率为 \(2^{-64}\)。基本上 \(10^6\) 以内个数都是可以接受的。

代码

using ull = unsigned long long;

const int MAXN = 1000001;

int a[MAXN];
ull sum[MAXN];
mt19937_64 rnd(time(0));
map<int, ull> mp;

bool Equiv(int l, int r, int l2, int r2) {
  return (sum[r] ^ sum[l - 1]) == (sum[r2] ^ sum[r2 - 1]);
}

for(int i = 1; i <= n; ++i) {
  cin >> a[i];
  if(!mp.count(a[i])) {
    mp[a[i]] = rnd();
  }
  sum[i] = (sum[i - 1] ^ a[i]);
}
posted @ 2024-09-02 12:08  Yaosicheng124  阅读(44)  评论(0编辑  收藏  举报