字符串哈希

定义

哈希,是一个十分无脑判断某两端字符串相同的方法(当然为了把保守我们也可以使用pb_ds库里的gb_hash_table)。

我通常使用哈希方法是 \(f(x)=f(x-1)\times b+s_x\)

转化成多项式形式那也就是:

\[f(x)=\sum_{i=1}^{x}s_i\times b^{x-i}\pmod p \]

其中 \(b\) 是一个小质数,\(p\) 是大质数(有时候使用unsigned long long自然溢出十分方便,但这是一个非常大众的选择,出题人可能会卡)。

考虑一个预处理:

h[0]=1,pw[0]=1;//pw[i]:表示b^i
for(int i=1;i<=n;i++)
{
    h[i]=(h[i-1]*b+s[i])%mod;
    pw[i]=pw[i-1]*b;
}

判断

上代码解释——

inline int check(int l,int r)//计算一个字符串 s[l,r] 的哈希值
{
    return (h[r]-h[l-1]*pw[r-l+1]+mod)%mod;//使用pw[r-l+1]将多乘的b给消掉
}

技巧

  1. \(b\)\(29\)
  2. 如果实在是害怕被卡,可以写双哈希(就是两个哈希函数判断同时算哈希值)甚至三哈希来保证哈希值的可靠性。
  3. 其实没有什么套路,十分无脑的感觉。
posted @ 2024-11-29 09:55  tyccyt  阅读(4)  评论(0编辑  收藏  举报