详解散列hashCode在HashMap中的使用原理

1散列的价值在于它的速度：散列使得查询变快，它将键key保存在某处，而我们知道存储一组数组最快的数据结构是数组，所以用它来表示键的信息(注意，数组保存的是键的信息，不是键本身)，由于数组是固定的，当我们希望在Map中存放不确定数量的对象时，数组本身不保存键本身，而是通过键生成一个数字，将其作为数组下标，这个下标数字就是散列码，由你自定义的hashCode()散列函数生成；

2为了解决数组容量固定问题，不同的键可以产生相同的下标，也就是可能有冲突，所以说数组多大不重要，任何键总能在数组中找到它的位置。

3 查询一个值的过程就是首先计算散列码，然后使用散列码查询数组(如果数值固定，就可能保证没有散列码冲突，那就有了一个完美的散列函数)，通常冲突由外部链接处理：数组并不保存值，而是保存值的list，然后对list中值使用equals()方法进行线性查询，当然最后这部分线性比较匹配会比较慢，但如果散列函数好的话，数组每个位置就只会有较少的值。因此并不是查询整个list，而是根据hashcode散列码跳到某个位置，只对该位置保存的list面很少的元素进行比较。这便是HashMap很快的原因；

下面写一个简单的hashMapDemo简要说明一下怎么使用散列码来快速查到key，解决冲突的：

　　1 散列表中槽位，通常称为桶位(bucket)，

　　2 为了使散列分布均匀，桶的数量通常使用

　　3 对于put()方法，hashCode()只对key使用，根据该key计算出的index位置如果是null，表示还没有元素被散列至此，所以要在该位置保存一个对象，就要先new 一个list(如果不为空则就用这个位置现存的list)然后遍历该list，查看是否有相同元素，如果有则替换位新元

　　素，如果没有，添加到list末尾；

　　4 get()用相同方式计算散列码为index，然后去index位置获取到元素list，遍历list，获取出以key位键的value

4 hashCode设计要点

　1 hashCode 方法不应该依赖于对象中异变的数据，因为该对象里面的数据一旦变化，hashCode()就会产生不同散列码，相当于产生一个不同键；

2 也不应该让hashCode()依赖具有唯一性的对象信息；

3 散列码应该基于对象中有意义的内容；

4 散列码更应该关注的是速度快，不用太关注独一无二(不同对象的散列码可以相同)，只要hashCode()和

equals()能确认对象身份即可；

5 生成键的索引前hashCode()值还要做进一步处理，所以散列码生成范围并不重要，int即可；

6 好的HashCode() 应该能产生分部均匀的散列码

7 编写合理HashCode()指导方法：

(1) 给INT 变量的result赋值非0常量

(2)为对象内每个有意义的域(即每个可以做equals()操作的域)计算出一个int散列码

(3)合并计算结果result=37*result+c;

posted @ 2019-04-14 18:12 会飞的喵星人阅读(301) 评论(0) 收藏举报

刷新页面返回顶部

会飞的喵星人

详解散列hashCode在HashMap中的使用原理

公告