HashMap索引位置计算

1. 前言

HashMap是基于底层叫Entry[]数组实现的一种哈希表

现在稍微深入一点,讲解HashMap里面的一个点:存取(put/get)数据的时候,Entry数组index下标的计算。

2. hashCode,hash与index的概念

a).put/get一个元素的时候,会调用该元素的hashCode方法,比如下面的自定义KeyObject类。

b).hashCode的数据会被用来计算hash值

如果细心的小伙伴,去print一下这个hash值,就会发现其实是一个非常大的整数,比如2028737这样的,显然这个hash值不会是底层Entry[]数组的index值。

所以总结一下:

  1. hashCode:HashMap的Key对象里面的方法hashCode产生的值
  2. hash:通过hashCode的值,通过一定算法产生的hash值
  3. index:通过hash值计算产生的,HashMap底层数组Entry[]的偏移值那计算index的方法是什么呢?

3 index的计算原则

Entry[]数组的长度在初始化的时候会被指定,假定这个值为length。

那index的值就从 0 ~ length-1。所以index需要尽可能的平衡,也就是分布均匀,不能某些位置上存储特别多的数据,某些位置上又特别少。

前面我们说过,通过hash值来计算index,那使用什么办法可以满足:

  1. 性能高效
  2. 均匀分析

4 index的计算方法

4.1 取模运算(方式一)

hash值为int,index需要映射到0 ~ length -1,最直观的使用取模运算,也就是:

index = hash值 % length 这个时候index的值的范围就是 0 ~ length -1

但是,Java 官方没有采用这个办法,因为这种效率不是最高的。

4.2 位运算(为什么长度一定是2的n次方)

为了解决取模效率的问题,Java官方采用了位运算的方法

index = hash值 & (length -1)

这个时候,如果要index的值的范围也是 0 ~ length -1,需要一个前置条件:

length的长度必须是2的n次幂。当length的长度是2的n次方时,有以下的公式成立:

因为:一个数num除以2n,相当于右移n位,那么移出去的那些数自然就是余数了,举个例子158除以8:

4.3 取模和位运算性能比较

看到这里会有人问,为什么取模运算会比位运算慢,慢多少呢?我们来做个实验:

5. 要点总结(常见问题)

  1. 如何计算index的
  2. 为什么不用取模,要用位运算
  3. 为什么长度一定是2的n次方

 

摘自:https://baijiahao.baidu.com/s?id=1646023968436883100&wfr=spider&for=pc

posted @ 2022-03-03 14:02  Arbitrary233  阅读(355)  评论(0编辑  收藏  举报