哈希表的基础理解

hashtable 也叫散列表

特点：快很快神奇的快

结构：结构有多种

最流行、最容易理解：顺序表+链表

主结构：顺序表

每个顺序表的节点在单独引出一个链表

哈希表是如何添加数据的

1.计算哈希码(调用hashCode(),结果是一个int值，整数的哈希码取自身即可)

2.计算在哈希表中的存储位置 y=k(x)=x%11

x:哈希码 k(x) 函数y：在哈希表中的存储位置

3.存入哈希表

n 情况1：一次添加成功

n 情况2：多次添加成功（出现了冲突，调用equals()和对应链表的元素进行比较，比较到最后，结果都是false，创建新节点，存储数据，并加入链表末尾）

n 情况3：不添加（出现了冲突，调用equals()和对应链表的元素进行比较，经过一次或者多次比较后，结果是true，表明重复，不添加）

结论1：哈希表添加数据快（3步即可，不考虑冲突）

结论2：唯一、无序

哈希表是如何查询数据的

和添加数据的过程是相同的

n 情况1：一次找到 23 86 76

n 情况2：多次找到 67 56 78

n 情况3：找不到 100 200

结论1：哈希表查询数据快

hashCode和equals到底有什么神奇的作用

l hashCode():计算哈希码，是一个整数，根据哈希码可以计算出数据在哈希表中的存储位置

l equals()：添加时出现了冲突，需要通过equals进行比较，判断是否相同；查询时也需要使用equals进行比较，判断是否相同

2.2.6.各种类型数据的哈希码应该如何获取 hashCode()

1.int 取自身看Integer的源码

2.double 3.14 3.15 3.145 6.567 9.87 取整不可以看Double的源码

3.String java oracle j+a+v+a 将各个字符的编码值相加不可以

abc cba bac a:97 b:98 c:99

abc 1*97+2*98+3*99 cba 1*99+2*98+3*97

4.Student 先各个属性的哈希码，进行某些相加相乘的运算

int id String name int age double score;

如何减少冲突

1）哈希表的长度和表中的记录数的比例--装填因子：

如果Hash表的空间远远大于最后实际存储的记录个数，则造成了很大的空间浪费，如果选取小了的话，则容易造成冲突。在实际情况中，一般需要根据最终记录存储个数和关键字的分布特点来确定Hash表的大小。还有一种情况时可能事先不知道最终需要存储的记录个数，则需要动态维护Hash表的容量，此时可能需要重新计算Hash地址。

装填因子=表中的记录数/哈希表的长度， 4/ 16 =0.25 8/ 16=0.5

如果装填因子越小，表明表中还有很多的空单元，则添加发生冲突的可能性越小；而装填因子越大，则发生冲突的可能性就越大，在查找时所耗费的时间就越多。有相关文献证明当装填因子在0.5左右时候，Hash性能能够达到最优。

因此，一般情况下，装填因子取经验值0.5。

2）哈希函数的选择

直接定址法平方取中法折叠法 除留取余法（y = x%11）

3）处理冲突的方法

链地址法开放地址法再散列法建立一个公共溢出区

posted @ 2021-01-06 17:29 巧克力曲奇阅读(390) 评论(0) 收藏举报

刷新页面返回顶部

巧克力曲奇