算法图解之散列表

1. 散列函数

散列函数就是将输入映射到数字。它必须满足两个条件：

如下图所示：

散列函数可以准确的指出价格的存储位置，具体原因如下：

1. 手机内置的电话簿

2. DNS解析，网址对应IP地址

3. 防止重复的一些场景，比如投票、领奖

4. 缓存。比如说Facebook，它会把经常访问但又不需要动态传递数据的网页的数据储存在散列表中，比如about、注册、登陆页面。当你访问Facebook的页面时，它首先检查散列表中是否存储了这些页面。这样可以大大降低服务器的压力，而且好的散列的运行时间是O(1)，效率比去服务器拿数据要快得多。

冲突就是给两个或多个键分配的位置相同。如果我们按字母表，给散列函数26个位置，那么相同开头的字母就会占据同一个位置，如下图：

这会比一开始将所有元素储存到一个链表中还慢。

1. 要想办法把散列函数的键均匀地映射到散列表的不同位置。

2.如果散列表存储的链表很长，散列表的速度将急剧下降。然而，如果使用的散列函数很好，这些链表就不会很长！

3. 散列函数很重要，好的散列函数很少导致冲突。

在平均情况下,散列表的查找速度与数组一样快，而插入和删除速度与链表一样快，因此它兼具两者的优点。但在最糟情况下，散列表的各种操作的速度都很慢。

避免最糟糕情况的关键是避免冲突，这需要：

填装因子 = 散列表包含的元素书 / 位置总数

一个经验规则是填装因子一旦大于0.7，就需要调整散列表的长度（resizing），通常将数组增长一倍，然后使用函数hash将所有的元素都插入到新的散列表中。

良好的散列函数让数组中的值呈均匀分布

糟糕的散列函数让值扎推，导致大量的冲突

一般的编程语言都实现了散列列表，而且能够获得平均情况下的性能（包括Python）：常量时间，O(1)

散列表是一种功能强大的数据结构，其操作速度快，还能让你以不同的方式建立数据模型。你可能很快会发现自己经常在使用它。

posted @ 2019-03-03 13:24 梁少华阅读(926) 评论(0) 收藏举报

刷新页面返回顶部