【哈希】散列表

合集 - 算法随笔(8)

1.【最小生成树】MST（Kruskal算法，Prim算法）2023-08-07 2.【最大子矩形】（悬线法，极大化思想）解析2023-08-18 3.【图论 & 迪杰斯特拉】Dijkstra（单源最短路径）2023-08-04 4.数据结构【字典树】 Trie Tree 【蒟蒻必看略解】2023-07-18 5.【动态规划 & 树形dp】Tree DP ~~~详解2023-07-29 6.【动态规划 & 换根dp】Change Root DP2023-11-06

7.【哈希】散列表2023-11-06

8.【欧拉图】Euler Graph（Fluery算法，Hierholzer算法）2023-11-06

还在更新ing

前言

此乃小 Oler 的一篇小小算法随笔，从今日后，还会进行详细的修订。

一、简单介绍

Hash 算法

Hash 算法可以将一个数据转换为一个标志，这个标志和源数据的每一个字节都有十分紧密的关系。

Hash 算法还具有一个特点，就是很难找到逆向规律。

Hash 算法是一个广义的算法，也可以认为是一种思想，使用Hash算法可以提高存储空间的利用率，可以提高数据的查询效率，也可以做数字签名来保障数据传递的安全性。所以 Hash 算法被广泛地应用在互联网应用中。

Hash 算法也被称为散列算法，Hash 算法虽然被称为算法，但实际上它更像是一种思想。 Hash 算法没有一个固定的公式，只要符合散列思想的算法都可以被称为是 Hash 算法。

若结构中存在和关键字 $K$ 相等的记录，则必定在 $f (K)$ 的存储位置上。由此，不需比较便可直接取得所查记录。称这个对应关系 $f$ 为散列函数（Hash function），按这个事先建立的表为散列表。

对不同的关键字可能得到同一散列地址，即 $k e y 1 \neq k e y 2$ ，而 $f (k e y 1) = f (k e y 2)$ ，这种现象称碰撞。具有相同函数值的关键字对该散列函数来说称做同义词。综上所述，根据散列函数 $H (k e y)$ 和处理冲突的方法将一组关键字映射到一个有限的连续的地址集（区间）上，并以关键字在地址集中的“象” 作为记录在表中的存储位置，这种表便称为散列表，这一映象过程称为散列造表或散列，所得的存储位置称散列地址。

若对于关键字集合中的任一个关键字，经散列函数映象到地址集合中任何一个地址的概率是相等的，则称此类散列函数为均匀散列函数（Uniform Hash function），这就是使关键字经过散列函数得到一个“随机的地址”，从而减少冲突。

散列表

所有散列函数都有如下一个基本特性：如果两个散列值是不相同的（根据同一函数），那么这两个散列值的原始输入也是不相同的。这个特性是散列函数具有确定性的结果。但另一方面，散列函数的输入和输出不是一一对应的，如果两个散列值相同，两个输入值很可能是相同的，但不绝对肯定二者一定相等（可能出现哈希碰撞）。输入一些数据计算出散列值，然后部分改变输入值，一个具有强混淆特性的散列函数会产生一个完全不同的散列值。

典型的散列函数都有无限定义域，比如任意长度的字节字符串，和有限的值域，比如固定长度的比特串。在某些情况下，散列函数可以设计成具有相同大小的定义域和值域间的一一对应。一一对应的散列函数也称为排列。可逆性可以通过使用一系列的对于输入值的可逆“混合”运算而得到。

散列表是散列函数的一个主要应用，使用散列表能够快速的按照关键字查找数据记录。（注意：关键字不是像在加密中所使用的那样是秘密的，但它们都是用来“解锁”或者访问数据的。）例如，在英语字典中的关键字是英文单词，和它们相关的记录包含这些单词的定义。在这种情况下，散列函数必须把按照字母顺序排列的字符串映射到为散列表的内部数组所创建的索引上。

散列表散列函数的几乎不可能/不切实际的理想是把每个关键字映射到的索引上（参考散列），因为这样能够保证直接访问表中的每一个数据。

一个好的散列函数（包括大多数加密散列函数）具有均匀的真正随机输出，因而平均只需要一两次探测（依赖于装填因子）就能找到目标。同样重要的是，随机散列函数几乎不可能出现非常高的冲突率。但是，少量的可以估计的冲突在实际状况下是不可避免的（参考生日悖论）。

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

注明：上述

二、代码实现

三、总结

题库

后记

posted @ 2023-11-06 14:01 Fireworks_Rise 阅读(5) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 数据结构【字典树】 Trie Tree 【蒟蒻必看略解】

· 【图论 & 迪杰斯特拉】Dijkstra（单源最短路径）

· Hash 表和散列函数思想理解

· Hash （散列函数）

· 算法之散列表

公告

昵称： Fireworks_Rise
园龄： 2年2个月
粉丝： 4
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

Fireworks-Rise

【哈希】散列表

还在更新ing

前言

一、简单介绍

Hash 算法

散列表

二、代码实现

三、总结

题库

后记

公告

搜索

常用链接

我的标签

合集

随笔分类

随笔档案

相册

阅读排行榜