康拓展开-排列的hash

对于一个集合内所有元素的排列,康拓展开是一个无冲突的hash法。其规则便是将排列在逻辑上排好序,然后每个排列的序号即是hash值。

关键就在如何快速求出序号和快速还原啦。

首先我们确定一好集合内各元素的大小关系,然后开始处理。

生成:

对于一个排列(长度为n),我们要算出它前面有多少比它小的序列,如果序号从0开始,那么这个数字就是它的序号。

有点类似数位DP的处理,我们从最高位看起(设位x),如果一个排列的最高位比它小,那么这个排列一定比它小。

所以设集合中比x小的元素有k个,如果最高位确定,那么后面的几位可以随意排列,显然有(n-1)!种,那么一共就有k*(n-1)!种。

最高位确定了,我们就考虑最高位相等时次高位的情况,处理方法是类似的,但是在计算k的时候,因为原先用过的数字已经不能出现在后面了,所以统计比x'小的元素时不能把他们算进去,然后乘上(n-2)!即可。

每一位都这样处理,就可以不重不漏啦。

 

复原:

因为不存在冲突,在系数k不超过n-i时,这个多项式的值我们可以用除法和取余来实现复原。

设hash值为val

k=val/(n-1)!

val%=(n-1)!//写成val-=k*(n-1)!也是可以的

k即是比当前位小的元素个数,val把当前项减去。

即可还原排列了。

 

代码:

class cantor
{
public:
#define siz 6
    char c[siz]= {'1','2','3','4','5','6'};
    LL w[siz];
    bool vis[siz];
    cantor()
    {
        w[0]=1;
        for(int i=1; i<siz; i++)
            w[i]=w[i-1]*i;
    }
    void init()
    {
        for(int i=0; i<siz; i++)
            vis[i]=false;
    }
    LL makeCanto(string s)
    {
        init();
        LL rec=0;
        for(int i=0; i<siz; i++)
        {
            int d=0;
            for(int j=0; j<siz; j++)
            {
                if(vis[j])
                    continue;
                if(c[j]!=s[i])d++;
                else
                {
                    vis[j]=true;
                    break;
                }
            }
            rec+=w[siz-i-1]*d;
        }
        return rec;
    }
    string recover(LL val)
    {
        init();
        string s="";
        for(int i=siz-1; i>=0; i--)
        {
            LL te=val/w[i];
            val%=w[i];
            for(int j=0,cnt=-1; j<siz; j++)
            {
                if(vis[j])continue;
                else cnt++;
                if(cnt==te&&!vis[j])
                {
                    s+=c[j];
                    vis[j]=true;
                    break;
                }
            }
        }
        return s;
    }
} ;

 

posted @ 2018-02-08 22:03  Luke_Ye  阅读(316)  评论(0编辑  收藏  举报