散列表(哈希表)
使用哈希查找有两个步骤:
- 使用哈希函数将被查找的键转换为数组的索引。在理想的情况下,不同的键会被转换为不同的索引值,但是在有些情况下我们需要处理多个键被哈希到同一个索引值的情况。所以哈希查找的第二个步骤就是处理冲突
- 处理哈希碰撞冲突。有很多处理哈希碰撞冲突的方法,本文后面会介绍拉链法和线性探测法。
哈希表是一个在时间和空间上做出权衡的经典例子。如果没有内存限制,那么可以直接将键作为数组的索引。那么所有的查找时间复杂度为O(1);如果没有时间限制,那么我们可以使用无序数组并进行顺序查找,这样只需要很少的内存。哈希表使用了适度的时间和空间来在这两个极端之间找到了平衡。只需要调整哈希函数算法即可在时间和空间上做出取舍。
哈希函数需要易于计算并且能够均匀分布所有键。
解决哈希冲突的方法
拉链法
把哈希后键值相同的数据存在一个链表中
开放定址法
所谓的开放定址法就是一旦发生了冲突,就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将记录存入。
1.线性探测法
如果发现当前地址已经被占据了就找下一个地址(地址值不断加1),知道找到空的散列地址。
2.二次探测法
3.随机探测法
再散列函数法
对于散列表来说,可以事先准备多个散列函数:
这里RHi 就是不同的散列函数,可以把前面说的除留余数、折叠、平方取中全部用上。每当发生散列地址冲突时,就换一个散列函数计算。 这种方法能够使得关键字不产生聚集,但相应地也增加了计算的时间。
参考博客
https://www.cnblogs.com/yangecnu/p/Introduce-Hashtable.html