取余数法实现哈希表(包括开放定址法和链地址法解决冲突)

常用的构造散列函数的方法

  1. 直接寻址法:取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a·key + b,其中a和b为常数(这种散列函数叫做自身函数)。若其中H(key)中已经有值了,就往下一个找,直到H(key)中没有值了,就放进去。

  2. 数字分析法:分析一组数据,比如一组员工的出生年月日,这时我们发现出生年月日的前几位数字大体相同,这样的话,出现冲突的几率就会很大,但是我们发现年月日的后几位表示月份和具体日期的数字差别很大,如果用后面的数字来构成散列地址,则冲突的几率会明显降低。因此数字分析法就是找出数字的规律,尽可能利用这些数据来构造冲突几率较低的散列地址。

  3. 平方取中法:取关键字平方后的中间几位作为散列地址。

  4. 折叠法:将关键字分割成位数相同的几部分,最后一部分位数可以不同,然后取这几部分的叠加和(去除进位)作为散列地址。数位叠加可以有移位叠加和间界叠加两种方法。移位叠加是将分割后的每一部分的最低位对齐,然后相加;间界叠加是从一端向另一端沿分割界来回折叠,然后对齐相加。

  5. 随机数法:选择一随机函数,取关键字的随机值作为散列地址,通常用于关键字长度不同的场合。

  6. 除留余数法:取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。即 H(key) = key MOD p,p<=m。不仅可以对关键字直接取模,也可在折叠、平方取中等运算之后取模。对p的选择很重要,一般取素数或m,若p选的不好,容易产生同义词。

处理冲突的方法

  1. 开放寻址法:Hi=(H(key) + di) MOD m,i=1,2,…,k(k<=m-1),其中H(key)为散列函数,m为散列表长,di为增量序列,可有下列三种取法:

    1.1. di=1,2,3,…,m-1,称线性探测再散列;

    1.2. di=1^2,-1^2,2^2,-2^2,⑶^2,…,±(k)^2,(k<=m/2)称二次探测再散列;

    1.3. di=伪随机数序列,称伪随机探测再散列。

  2. 再散列法:Hi=RHi(key),i=1,2,…,k RHi均是不同的散列函数,即在同义词产生地址冲突时计算另一个散列函数地址,直到冲突不再发生,这种方法不易产生“聚集”,但增加了计算时间。

  3. 链地址法(拉链法)

  4. 建立一个公共溢出区

 

开放定址法
#include <iostream>
#define NULLKEY 0//0为无记录标志
#define SUCCESS 1  
#define UNSUCCESS 0  
#define DUPLICATE -1
using namespace std;

int hashsize[]={11,19,29,37};//哈希表容量递增表(一个合适的素数序列)
int Hash_length=0;//哈希表表长

//定义记录
struct ElemType{
    int key_value;
    float weight;
};
//定义哈希表
struct HashTable{
    ElemType *elem;//数据元素存储基址(动态分配数组)
    int count;//当前数据元素个数 
    int size_index;//hashsize[size_index]为当前容量 
};

//初始化哈希表
int InitHashTable(HashTable &ht){
    ht.count=0;
    ht.size_index=0;
    Hash_length=hashsize[ht.size_index];//表长为全局变量
    ht.elem=(ElemType*)malloc(Hash_length*sizeof(ElemType));
    if(!ht.elem) exit(1);
    for(int i=0;i<Hash_length;i++){ht.elem[i].key_value=NULLKEY;}//方便后面判断对应位置是否被占用
    return 1;
}

//销毁哈希表。
//初始条件:哈希表ht存在;操作结果:销毁哈希表ht 
void DestroyHashTable(HashTable &ht)  
{  
    if(ht.elem != NULL) free(ht.elem);  
    ht.elem=0;  
    ht.count=0;  
    ht.size_index=0;  
} 

//一个简单的哈希函数,其中Hash_length为表长
int Hash(int K)  
{  
    return K%Hash_length;//key MOD p(其中p<=Hash_length)
} 

//开放定址法处理冲突,Hash_length为表长,线性探测再散列
int collision(int H_key,int d)  
{  
    return (H_key+d)%Hash_length;
}

//在开放定址哈希表H中查找关键码为K的元素,
//若查找成功,以p指示待查数据元素在表中位置,并返回SUCCESS;
//否则,以p指示插入位置,并返回UNSUCCESS。
//注意:c用以计冲突次数,其初值置零,供建表插入时参考
int SearchHash(HashTable ht, int key, int &p, int &c){
    p=Hash(key);
    int p_original=p;
    c = 0;
    while(c<hashsize[ht.size_index] && ht.elem[p].key_value!=NULLKEY && ht.elem[p].key_value!=key){
        c++;
        p=collision(p_original,c);
    }

    if(ht.elem[p].key_value==key)
        return SUCCESS;
    else
        return UNSUCCESS;
}

//删除元素
int DeleteElem(HashTable ht, int key){
    int p, c=0;
    if (SearchHash(ht, key, p, c)==SUCCESS){
        ht.elem[p].key_value=NULLKEY;
        ht.count--;
        return SUCCESS;
    }
    else{
        return UNSUCCESS;
    }
}

void RecreateHashTable(HashTable &ht);

//查找不成功时插入数据元素e到开放定址哈希表ht中,并返回1,若冲突次数过大,则重建哈希表
int InsertHash(HashTable &ht, ElemType e){
    int p, c=0;
    if(SearchHash(ht, e.key_value, p, c)==SUCCESS){//已经存在e
        return DUPLICATE;
    }
    else if(c<hashsize[ht.size_index]/2){//不存在e,冲突次数c未达到上限hashsize[ht.size_index]/2
        ht.elem[p]=e;
        ht.count++;
        return SUCCESS;
    }
    else {//不存在e,冲突次数c达到上限
        RecreateHashTable(ht);//重建新的哈希表ht,ht的容量以及元素的位置发生变化
        InsertHash(ht, e);//将元素插入
        return SUCCESS;
    }
}

void RecreateHashTable(HashTable &ht)//重建哈希表
{
    printf("冲突次数达到上限,增大表长,重建哈希表。。。\n"); 

    ElemType* p_tmp=ht.elem;//暂存
    int size_index_tmp=ht.size_index;//暂存

    //增大存储容量,给ht.elem重新分配空间
    ht.count=0;
    ht.size_index++;
    Hash_length=hashsize[ht.size_index];//更新Hash_length
    ElemType* p_new=(ElemType*)malloc(Hash_length*sizeof(ElemType));
    if(!p_new) exit(1);
    ht.elem=p_new;

    //初始化
    for(int i=0;i<Hash_length;i++)
        ht.elem[i].key_value=NULLKEY;

    //将tmp中的原有的数据按照新的表长插入到重建的哈希表中
    for(int i=0;i<hashsize[size_index_tmp];i++){
        if((p_tmp+i)->key_value!=NULLKEY){
            InsertHash(ht,*(p_tmp+i));
        }
    }

    delete[] p_tmp;
    printf("重建哈希表成功!\n"); 
}


/* 按哈希地址的顺序遍历哈希表 */  
void TraverseHash(HashTable ht,void(*Visit)(int, ElemType)){
    printf("哈希地址:0~%d\n",Hash_length-1);
    for(int i=0;i<Hash_length;i++){
        if(ht.elem[i].key_value!=NULLKEY) Visit(i,ht.elem[i]);
    }

}

void main(){
    while(1){
        //ElemType r[12]={{17,1},{60,2},{29,3},{38,4},{1,5},{2,6},{3,7},{4,8},{5,9},{6,10},{7,11},{8,12}};
        ElemType r[12]={{17,1},{60,2},{29,3},{38,4},{1,5},{2,6},{3,7},{4,8},{5,9},{6,10},{60,9},{13,10}};
        HashTable h;
        InitHashTable(h);

        cout<<"向哈希表中插入记录。。。"<<endl;
        for(int i=0;i<sizeof(r)/sizeof(r[0]);i++){
            if(InsertHash(h,r[i]) == DUPLICATE){
                cout<<"表中已有关键字"<<r[i].key_value<<"的记录,无法再插入该记录!"<<endl;
                cout<<"继续插入后续元素。。。"<<endl;
            }
        }

        printf("按哈希地址的顺序遍历哈希表:\n");
        TraverseHash(h,Print_Hash);

        DeleteElem(h,29);

        printf("按哈希地址的顺序遍历哈希表:\n");
        TraverseHash(h,Print_Hash);

        printf("销毁哈希表。。。\n");
        DestroyHashTable(h);
        system("pause");
    }
}

 

链地址法解决冲突
#include <iostream>

#define HASH_LENGTH 13
#define NULLKEY 0//0为无记录标志

using namespace std;



//定义记录
struct ElemType1{
    int key_value;
    float weight;
};

//定义每个子链的结点
struct Node{
    ElemType1 elem;
    struct Node *next;
};

//定义哈希表的结点
struct HashTable_Node{
    int h_value;//除取余数得到的哈希值
    struct Node *pointer;//每个子链的首地址
};

//定义链地址法的哈希表
typedef HashTable_Node* HashTable_L;

//一个简单的哈希函数,其中HASH_LENGTH为表长
int Hash1(int K)  
{  
    return K%HASH_LENGTH;//key MOD p(其中p<=HASH_LENGTH)
} 

void Hash_Init(HashTable_L &ht){//哈希表初始化
    ht=new HashTable_Node[HASH_LENGTH];
    if (!ht) exit(1);
    for(int i = 0; i < HASH_LENGTH; i++){
        ht[i].h_value=NULLKEY;//方便插入和查找
        ht[i].pointer=NULL;
    }
}

void Hash_Insert(HashTable_L &ht, ElemType1 e){
    int p=Hash1(e.key_value);

    Node* node=new Node();
    if (!node) exit(1);
    node->elem=e;
    node->next=NULL;

    if(ht[p].h_value == NULLKEY){//对应该哈希值的子链为空
        ht[p].pointer=node;
        ht[p].h_value=p;
    }
    else if(ht[p].h_value == p){//对应该哈希值的子链不为空
        Node* ptr=ht[p].pointer;
        while(ptr->next){ptr=ptr->next;}
        ptr->next=node;
    }
}

Node* Hash_Search(HashTable_L ht, int key){
    int p=Hash1(key);
    if(ht[p].h_value == NULLKEY)//对应该哈希值的子链为空
        return NULL;
    else if(ht[p].h_value == p){//对应该哈希值的子链不为空
        Node* ptr=ht[p].pointer;
        while(ptr != NULL){
            if(ptr->elem.key_value == key){
                return ptr;
            }
            ptr=ptr->next;
        }
    }
    else
        return NULL;
}


void main(){
    ElemType1 r[13]={{17,1},{60,2},{29,3},{38,4},{1,5},{2,6},{60,2},{3,7},{4,8},{5,9},{6,10},{7,11},{8,12}};
    //ElemType1 r[13]={{17,1},{60,2},{29,3},{38,4},{1,5},{2,6},{3,7},{4,8},{5,9},{6,10},{7,11},{8,12}};

    HashTable_L ht=NULL;
    Hash_Init(ht);

    for(int i=0;i<sizeof(r)/sizeof(r[0]);i++){
        Hash_Insert(ht, r[i]);
    }

    while (1)
    {
        int key;
        cout<<"请输入关键字(key):";
        cin>>key;
        Node *p=NULL;
        if(p=Hash_Search(ht, key))
            cout<<"哈希值与关键字的值分别为:"<<Hash1(key)<<" "<<p->elem.key_value<<endl;
        else
            cout<<"无匹配!"<<endl;
    }
}
posted @ 2012-10-23 23:06  杨小明  阅读(1419)  评论(0编辑  收藏  举报