关于hashMap中计算hashCode的逻辑推理（二）

hashMap中，为了使元素在数组中尽量均匀的分布，所以使用取模的算法来决定元素的位置.如下：

1 //方法一：
2 static final int hash(Object key){//jdk1.8
3   int h;
4   return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
5 }
6 //方法二：
7 static int indexFor(int h,int length){//低版本的源码
8   return h & (length - 1);//第三步，取模运算
9 }

方法一是我当前使用jdk版本的源码，

方法二是在网上查到的低版本的源码，

首先确认：当length总是2的n次方时， h & (length - 1) 等价于 hash对length取模，但是&比%具有更高的效率；（下文有对该方法的说明）.

其次，方法一和方法二的原理是一样的，

在JDK1.8的实现中，优化了高位运算的算法，通过hashCode()的高16位异或低16位实现的：(h = k.hashCode()) ^ (h >>> 16)，

主要是从速度、功效、质量来考虑的，这么做可以在数组table的length比较小的时候，也能保证考虑到高低Bit都参与到Hash的计算中，同时不会有太大的开销。

-----------------------------------

另开头：

为什么数组大小为2的幂时hashmap访问性能最高？

我在网上查了一些博文，好多都”举例说明“，来以事实说话，

其实我感觉这有取巧的嫌疑，

以下为我个人理解（错误的理解，文章结尾处已写明）：

为什么取length（奇数）-1？而不是 length（偶数）-1？

在进行&（逻辑与）运算时（例：a & b），只有当 a =true and b =true 时，结果才是 1，否则都是0；

所以，当 hash & 偶数时，二进制结果就总会是偶数，这就导致数组的偶数位被浪费，数组的奇数位的冲突概率增高.

基于以上，所以存储位置index = h & (length - 1)；中length取偶数使得 hashMap具有更高的性能.

至于为什么选择为2的幂？接触尚短，我暂时还没想到，待后续.

-----------------------------------------------------------------------------------------

通过研读前辈们的博文，以下为为什么使用 2的幂作为数组长度：

当容量一是为2的幂时，h&(length - 1) == h%length,它俩是等价不等效的.！！！！！！！！

-------------------------

推导：

2^n转换成二进制就是1+n个0，减1之后就是0+n个1，如16 -> 10000，15 -> 01111,那根据&位运算规则，都为1时，才为1，那0≤运算后的结果≤15，

假设h <= 15，那么运算后的结果就是h本身，h >15，运算后的结果就是最后三位二进制做&运算后的值，最终，就是%运算后的余数.

补充：

通过位运算（不用模运算符%）求余

前提：a/b的除数 b必须为2的你次方.也就是说b必须是

2的一次方 1

2的二次方 4

2的三次方 8

......

只有是这样的一种情况，这种方法才是正确的.

如下两种方法：

方法一：a%b = a&( b -1);

例：

a=9 ， b= 8. 小括号内的值为b-1 = 8-1 =7. 9 的二进制表现：1001,7的二进制表现：0111， a%b = a&(b-1) = 9%8 = 9&(8-1) 的结果值：0001 = 1.也就是说，余数为1.结果是正确的.

方法二：a%b = a-((a>>log2[b])<<log2[b]);

例:

初始值还是 a= 9，b = 8. a-((a>>3）<<3) 先右移3位，再左移三维，然后a减去移位后的值.

在hashMap中使用的方法一.

因此，容量（数组长度）必须为2的幂方.

上文中我自己的想法也是不对的. 长度取偶数 那只是取2的幂方的 结果属性.并不是原因之一.上文就不删改了，留下个记号完整学习过程.

posted @ 2017-04-27 22:21 it馅儿包子阅读(498) 评论(0) 收藏举报

刷新页面返回顶部

it馅儿包子

关于hashMap中 计算hashCode的逻辑推理（二）

公告

关于hashMap中计算hashCode的逻辑推理（二）