字符串HASH 学习总结 && 模板
一、字符串HASH模板 取自挑战程序设计竞赛(第2版)
</pre><pre code_snippet_id="446698" snippet_file_name="blog_20140809_1_9461278" name="code" class="cpp">/*===================================================*\ 从b串中寻找和a串长度同样的子串,返回開始位置 不保证绝对正确,发生冲突概率为O(sqrt(n)), n为哈希函数的最大值 \*===================================================*/ #define ull unsigned long long const ull B = 1e8+7; /*according to the book*/ const int MAXN = 1001; char a[MAXN],b[MAXN]; int HashFind()/*返回匹配位置的開始处的下标,-1表示没有匹配*/ { int al=strlen(a),bl=strlen(b); if(al>bl)return -1; ull t=1,ah=0,bh=0; for(int i=0;i<al;i++) { t*=B; ah=ah*B+a[i]; bh=bh*B+b[i]; } for(int i=0;i+al<=bl;i++) { if(ah == bh)return i; if(i+al < bl)bh=bh*B+b[i+al]-b[i]*t; } return -1; } /*===================================================*\ 滚动哈希--滚动通过ull的溢出实现,相当于mod 2^64 \*===================================================*/ #define ull unsigned long long const int MAXN = 1001; const ull B = 1e8+7; /*according to the book*/ char a[MAXN],b[MAXN]; int OverLap()/*a的后缀和b的前缀相等的最大长度*/ { int al=strlen(a),bl=strlen(b),ans=0; int minlen=min(al,bl); ull t=1,ah=0,bh=0; for(int i=1;i<minlen;i++) { ah=ah+a[al-i]*t; bh=bh*B+b[i-1]; if(ah == bh)ans=i; t*=B; } return ans; }
二、字符串HASH的求法:(注意我不同颜色标记的地方,假设WA,一定看看那里是不是写对了)
1、直接ah[i]=ah[i-1]*base+a[i],那么长度为len的哈希值就是ah[i]-ah[i-len]*base[len] 此处ah[i]表示长为i字符串的哈希值
北京邀请赛的题,为了能做到在O(1)时间内算出hash值---比方算从l到r这段字符串的hash值,能够直接ah[r]-ah[l-1](当然须要推断l>=1,或者直接字符串从下标为1開始)。便于进行二分,就是这么写的
http://blog.csdn.net/u011026968/article/details/38473707
2、逐步递推:hash[i]=hash[i-1]*base+a[i]-a[i-len]*base[len] 再写字符矩阵匹配的时候两种写法我弄混了...o(╯□╰)o
三、HASH的其它构造方法:
1、假设限定了字符数目,能够映射为对应进制的数,如http://blog.csdn.net/u011026968/article/details/38490653