数据结构 - 哈希表

哈希表

1. 哈希表的引入

1.1 哈希表的简单概述

　哈希表一个通过哈希函数来计算数据存储位置的数据结构，通常支持如下操作 (高效的操作)：python中的字典是通过哈希表实现的

1.2.直接寻址表

当关键字的key 的全域U(关键字可能出现的范围)比较小时，直接寻址是一种简单而有效的方法

直接寻址技术缺点：

2. 哈希与哈希表

2.1 改进直接寻址表: 哈希

2.2 哈希表

2.2.1简单的hash函数

2.2存储机制

以除法哈希为例讨论下存储机制以及存在的问题

假设有一个长度为7的数组，哈希函数h(k)=k mod 7,元素集合{14,22,3,5}的存储方式如下图。

解释:

3.哈希冲突 &解决方法

3.1 哈希冲突

由于哈希表的大小是有限的，而要存储的值的总数量是无限的，因此对于任何哈希函数，都会出现两个不同元素映射到同一个位置上的情况，这种情况叫做哈希冲突。

3.2 解决哈希冲突

3.2.1开放寻址法

如果哈希函数返回的位置已经有值，则可以向后探查新的位置来存储这个值。

保证有空位存储 - > 动态扩张

同样装载率因子 a = n / m a超过阈值是,将哈希表扩张一倍,重新计算哈希函数值,将值重新进行存储

查询:线性探查的问题 : 会导致大量的空格,大量的值连在一起,导致查询的时候变慢 ,当值分散开较好

为了解决上述问题,使用二次探查的方法

3.2.2拉链法

哈希表每个位置都连接一个链表，当冲突发生时，冲突的元素将被加到该位置链表的最后

当一个位置后边的链表太长,再查找的时候会很慢

同样拉链法也需要在装载率因子超过阈值的时候动态扩张 (但是他可以大于1)

注: 由于key必须通过hash函数计算出一个整数,因此必须是不可变的数据类型

posted @ 2019-04-11 00:17 一路向北_听风阅读(409) 评论(0) 编辑收藏举报

刷新页面返回顶部

一路向北_听风