散列表

前几天看《linux内核设计与实现》的时候，发现一个新名词（对于我来说）“散列表”，直接给我看蒙住了，散列表是个什么鬼，于是今天晚上找了本数据结构的书，来学习下散列表这个新东西。

散列表：

既是一种存储的技术，又是一种查找的技术，也就是说可以用它来查找与存储，不同于一般的存储与查找，一般正常的存储，举个例子一个已经存在的数组，其中每一个数据内容与它的下标都是一一对应的关系，需要查找时就进行一次遍历要么找到，要么没找到。很直接，要找的内容都是固定的，但是散列表并不用来处理这类查找。散列表把你需要查找的关键字与其下标建立了一种关系，就像上面所说过的，一个数组的下标和它里面存在的内容没有半毛钱的关系。但是散列表则不然，散列表把存储的东西与下标建立了一种有规则的关系，这种规则你自己定。但是定的方法很讲究，一会再说。

还是给一个关于散列表的官方定义吧

散列表：

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希(Hash）表，函数f(key)为哈希(Hash) 函数。

以上定义来自百度百科。

其实和我说的差不多，那个有规则的关系就是哈希函数。可以同时定义多个哈希函数。

现在来说说散列表的构造方法：

直接定址法：

取关键字的某个线性函数值为散列表地址

f(key) = a * key + b;

数字分析法：

将某些特定的数字进行处理，例如131XXXXX1234，132XXXXX6789.。。。。例如这些手机号，其实只有后边的4位数字是相同的那么我们，就应当取处后面的4位进行比较甄别。

简单来说就是屏蔽掉重复的数字，主要处理那些能够表征问题的数字。

平方取中法：

就是如字面意思将一个数字平方然后取中间的某几位数字，其实做了这么多只是为了排除那些重复的关键字，这是我们的原则，根据不同的需求选择不同的哈希方法，如果有人可以想出万用的哈希函数，那么也不失为一个壮举。

除留余数法：

就是给定的东西取余，得出余数，以余数作为存储的下标，当然余数是很可能相同的所以如果出现相同的情况就对除数+1，一直这样下去，直到找出可以放置的位置为止。

还有随机数法，溢出数表。。。。。多种方法，原则就是打造出适合问题的哈希函数。

下面贴上一个代码：就是使用余数法建议一个散列表，这个散列表初始化位5个存储位置，首先进行5个数字的存入操作，然后可以输入一个数字，查找出它在散列表中的存储位置。

#include<stdlib.h>
#include<string.h>
#define SUCCESS 1
#define UNSUCCESS 0
#define HASHSIZE  12
#define NULLKEY   -32768
#define OK        2

typedef struct hashtable{
    int *elem;   //数据元素存储基址，动态分配数组
    int count;   //当前数据元素个数
}HASHTABLE;

int m = 5;       //散列表表长

int init_hashtable(HASHTABLE *H)    //初始化散列表
{
    int i;           
    H->count = m;
    H->elem  = (int *)malloc(m*sizeof(int));
    if(H->elem == NULL){
        printf("malloc error :%d\n",__LINE__);
    }
    for(i = 0;i<m;i++)
    {
        H->elem[i] = NULLKEY;
    }
    return OK;
}


int HASH(int key)           //散列函数
{
    return key % m;
}
void inserthash(HASHTABLE *H,int key)    //插入关键字进散列表
{
    int addr = HASH(key);               //求散列表
    while(H->elem[addr] != NULLKEY)     //如果不为空，则冲突
        addr = (addr+1)%m;              //开放定址法的线性探测
    H->elem[addr] = key;                //直到有空位后插入关键字
}

int searchhash(HASHTABLE H,int obj,int *addr)  //散列表查找关键字
{
    *addr = HASH(obj);                      //求散列表地址
    while(H.elem[*addr]!= obj)               //如果不为空则冲突
    {
        *addr = (*addr+1)%m;                //开放定址法的线性探测
        if(H.elem[*addr] == NULLKEY || *addr == HASH(obj))
        {                         //如果循环回到原点
            return UNSUCCESS;         //则说明关键字不存在
        }
    }
    return SUCCESS;
}

int main()
{
    HASHTABLE H = {NULL,0}; 
    int key;
    int obj;
    int addr;
    int ret;
    init_hashtable(&H);    //初始化散列表
    int i = 5;
    for(i=0;i<5;i++)
    {
     printf("please enter your key:");
     scanf("%d",&key);
     inserthash(&H,key);    //插入关键字进散列表
     key = 0;
    }
    printf("please enter what number you want:");
    scanf("%d",&obj);
    ret = searchhash(H,obj,&addr);  //散列表查找关键字
    if(ret == 0){
        printf("sorry no obj\n");
    }else{
        printf("yes we find it %d\n",addr);
    }
    return 0;
}

posted on 2015-06-16 21:24 zmrlinux 阅读(239) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

zmrlinux

散列表

导航

公告