字符串HASH 学习总结 && 模板

一、字符串HASH模板  取自挑战程序设计竞赛(第2版)

</pre><pre code_snippet_id="446698" snippet_file_name="blog_20140809_1_9461278" name="code" class="cpp">/*===================================================*\
    从b串中寻找和a串长度同样的子串,返回開始位置
    不保证绝对正确,发生冲突概率为O(sqrt(n)),
    n为哈希函数的最大值
\*===================================================*/

#define ull unsigned long long
const ull B = 1e8+7;    /*according to the book*/
const int MAXN = 1001;
char a[MAXN],b[MAXN];

int HashFind()/*返回匹配位置的開始处的下标,-1表示没有匹配*/
{
    int al=strlen(a),bl=strlen(b);
    if(al>bl)return -1;
    ull t=1,ah=0,bh=0;
    for(int i=0;i<al;i++)
    {
        t*=B;
        ah=ah*B+a[i];
        bh=bh*B+b[i];
    }
    for(int i=0;i+al<=bl;i++)
    {
        if(ah == bh)return i;
        if(i+al < bl)bh=bh*B+b[i+al]-b[i]*t;
    }
    return -1;
}

/*===================================================*\
    滚动哈希--滚动通过ull的溢出实现,相当于mod 2^64

\*===================================================*/

#define ull unsigned long long
const int MAXN = 1001;
const ull B = 1e8+7;    /*according to the book*/
char a[MAXN],b[MAXN];

int OverLap()/*a的后缀和b的前缀相等的最大长度*/
{
    int al=strlen(a),bl=strlen(b),ans=0;
    int minlen=min(al,bl);
    ull t=1,ah=0,bh=0;
    for(int i=1;i<minlen;i++)
    {
        ah=ah+a[al-i]*t;
        bh=bh*B+b[i-1];
        if(ah == bh)ans=i;
        t*=B;
    }
    return ans;
}


二、字符串HASH的求法:(注意我不同颜色标记的地方,假设WA,一定看看那里是不是写对了)
1、直接ah[i]=ah[i-1]*base+a[i],那么长度为len的哈希值就是ah[i]-ah[i-len]*base[len]  此处ah[i]表示长为i字符串的哈希值

北京邀请赛的题,为了能做到在O(1)时间内算出hash值---比方算从l到r这段字符串的hash值,能够直接ah[r]-ah[l-1](当然须要推断l>=1,或者直接字符串从下标为1開始)。便于进行二分,就是这么写的

http://blog.csdn.net/u011026968/article/details/38473707

2、逐步递推:hash[i]=hash[i-1]*base+a[i]-a[i-len]*base[len]  再写字符矩阵匹配的时候两种写法我弄混了...o(╯□╰)o

三、HASH的其它构造方法:
1、假设限定了字符数目,能够映射为对应进制的数,如http://blog.csdn.net/u011026968/article/details/38490653


posted @ 2017-04-13 09:21  mfmdaoyou  阅读(386)  评论(0编辑  收藏  举报