代码改变世界

《算法导论》第11章 散列表 (1)直接寻址表

2012-03-07 22:54  htc开发  阅读(189)  评论(0编辑  收藏  举报


(一)直接寻址表

关键字集合U = { 0, 1, ..., m - 1 },实际的关键字集合K。
用一个数组T[0..m - 1],其中每个位置对应U中的一个关键字。




直接寻址表的问题:

(1)如果U很大,要保存|U|大小的一张表T有点不实际。
(2)实际存储的关键字集合K相对U来说可能很小,因而分配给T的大部分空间都要浪费掉。


(二)位向量

位向量 (bit vector)是一种仅包含0和1的数组,所占空间比包含指针的数组少得多。
一个32位的整型,每一位用0和1表示key是否存在,这样一个整数就可以表示32个key。

key / 32表示key应保持在数组哪个下标的整数中,而key % 32则表示key应该用
该整数中的第几位置1来表示存在。


更快速、简洁的表示方法是用位运算来表示除法和求余。

key >> 5表示key / 32
key & 0x1F表示key % 32


一道笔试题:

腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?