康拓展开-排列的hash

对于一个集合内所有元素的排列，康拓展开是一个无冲突的hash法。其规则便是将排列在逻辑上排好序，然后每个排列的序号即是hash值。

关键就在如何快速求出序号和快速还原啦。

首先我们确定一好集合内各元素的大小关系，然后开始处理。

生成：

对于一个排列（长度为n），我们要算出它前面有多少比它小的序列，如果序号从0开始，那么这个数字就是它的序号。

有点类似数位DP的处理，我们从最高位看起（设位x），如果一个排列的最高位比它小，那么这个排列一定比它小。

所以设集合中比x小的元素有k个，如果最高位确定，那么后面的几位可以随意排列，显然有(n-1)!种，那么一共就有k*(n-1)!种。

最高位确定了，我们就考虑最高位相等时次高位的情况，处理方法是类似的，但是在计算k的时候，因为原先用过的数字已经不能出现在后面了，所以统计比x'小的元素时不能把他们算进去，然后乘上(n-2)!即可。

每一位都这样处理，就可以不重不漏啦。

复原：

因为不存在冲突，在系数k不超过n-i时，这个多项式的值我们可以用除法和取余来实现复原。

设hash值为val

k=val/(n-1)!

val%=(n-1)!//写成val-=k*(n-1)!也是可以的

k即是比当前位小的元素个数，val把当前项减去。

即可还原排列了。

代码：

class cantor
{
public:
#define siz 6
    char c[siz]= {'1','2','3','4','5','6'};
    LL w[siz];
    bool vis[siz];
    cantor()
    {
        w[0]=1;
        for(int i=1; i<siz; i++)
            w[i]=w[i-1]*i;
    }
    void init()
    {
        for(int i=0; i<siz; i++)
            vis[i]=false;
    }
    LL makeCanto(string s)
    {
        init();
        LL rec=0;
        for(int i=0; i<siz; i++)
        {
            int d=0;
            for(int j=0; j<siz; j++)
            {
                if(vis[j])
                    continue;
                if(c[j]!=s[i])d++;
                else
                {
                    vis[j]=true;
                    break;
                }
            }
            rec+=w[siz-i-1]*d;
        }
        return rec;
    }
    string recover(LL val)
    {
        init();
        string s="";
        for(int i=siz-1; i>=0; i--)
        {
            LL te=val/w[i];
            val%=w[i];
            for(int j=0,cnt=-1; j<siz; j++)
            {
                if(vis[j])continue;
                else cnt++;
                if(cnt==te&&!vis[j])
                {
                    s+=c[j];
                    vis[j]=true;
                    break;
                }
            }
        }
        return s;
    }
} ;

posted @ 2018-02-08 22:03 Luke_Ye 阅读(334) 评论(0) 收藏举报

刷新页面返回顶部

Luke_Ye

康拓展开-排列的hash

公告