哈希表的基础理解
hashtable 也叫散列表
特点:快 很快 神奇的快
结构:结构有多种
最流行、最容易理解:顺序表+链表
主结构:顺序表
每个顺序表的节点在单独引出一个链表
哈希表是如何添加数据的
1.计算哈希 码(调用hashCode(),结果是一个int值,整数的哈希码取自身即可)
2.计算在哈希表中的存储位置 y=k(x)=x%11
x:哈希码 k(x) 函数y:在哈希表中的存储位置
3.存入哈希表
n 情况1:一次添加成功
n 情况2:多次添加成功(出现了冲突,调用equals()和对应链表的元素进行比较,比较到最后,结果都是false,创建新节点,存储数据,并加入链表末尾)
n 情况3:不添加(出现了冲突,调用equals()和对应链表的元素进行比较, 经过一次或者多次比较后,结果是true,表明重复,不添加)
结论1:哈希表添加数据快(3步即可,不考虑冲突)
结论2:唯一、无序
哈希表是如何查询数据的
和添加数据的过程是相同的
n 情况1:一次找到 23 86 76
n 情况2:多次找到 67 56 78
n 情况3:找不到 100 200
结论1:哈希表查询数据快
hashCode和equals到底有什么神奇的作用
l hashCode():计算哈希码,是一个整数,根据哈希码可以计算出数据在哈希表中的存储位置
l equals():添加时出现了冲突,需要通过equals进行比较,判断是否相同;查询时也需要使用equals进行比较,判断是否相同
2.2.6.各种类型数据的哈希码应该如何获取 hashCode()
1.int 取自身 看Integer的源码
2.double 3.14 3.15 3.145 6.567 9.87 取整不可以 看Double的源码
3.String java oracle j+a+v+a 将各个字符的编码值相加不可以
abc cba bac a:97 b:98 c:99
abc 1*97+2*98+3*99 cba 1*99+2*98+3*97
4.Student 先各个属性的哈希码,进行某些相加相乘的运算
int id String name int age double score;
如何减少冲突
1)哈希表的长度和表中的记录数的比例--装填因子:
如果Hash表的空间远远大于最后实际存储的记录个数,则造成了很大的空间浪费, 如果选取小了的话,则容易造成冲突。 在实际情况中,一般需要根据最终记录存储个数和关键字的分布特点来确定Hash表的大小。还有一种情况时可能事先不知道最终需要存储的记录个数,则需要动态维护Hash表的容量,此时可能需要重新计算Hash地址。
装填因子=表中的记录数/哈希表的长度, 4/ 16 =0.25 8/ 16=0.5
如果装填因子越小,表明表中还有很多的空单元,则添加发生冲突的可能性越小;而装填因子越大,则发生冲突的可能性就越大,在查找时所耗费的时间就越多。 有相关文献证明当装填因子在0.5左右时候,Hash性能能够达到最优。
因此,一般情况下,装填因子取经验值0.5。
2)哈希函数的选择
直接定址法 平方取中法 折叠法 除留取余法(y = x%11)
3)处理冲突的方法
链地址法 开放地址法 再散列法 建立一个公共溢出区