字符串哈希
定义
哈希,是一个十分无脑判断某两端字符串相同的方法(当然为了把保守我们也可以使用pb_ds
库里的gb_hash_table
)。
我通常使用哈希方法是 \(f(x)=f(x-1)\times b+s_x\) 。
转化成多项式形式那也就是:
\[f(x)=\sum_{i=1}^{x}s_i\times b^{x-i}\pmod p
\]
其中 \(b\) 是一个小质数,\(p\) 是大质数(有时候使用unsigned long long
自然溢出十分方便,但这是一个非常大众的选择,出题人可能会卡)。
考虑一个预处理:
h[0]=1,pw[0]=1;//pw[i]:表示b^i
for(int i=1;i<=n;i++)
{
h[i]=(h[i-1]*b+s[i])%mod;
pw[i]=pw[i-1]*b;
}
判断
上代码解释——
inline int check(int l,int r)//计算一个字符串 s[l,r] 的哈希值
{
return (h[r]-h[l-1]*pw[r-l+1]+mod)%mod;//使用pw[r-l+1]将多乘的b给消掉
}
技巧
- \(b\) 取 \(29\)
- 如果实在是害怕被卡,可以写双哈希(就是两个哈希函数判断同时算哈希值)甚至三哈希来保证哈希值的可靠性。
- 其实没有什么套路,十分无脑的感觉。