hashmap里面hash计算疑问点

hashmap里面计算hash和放入数组中的计算疑问点:

static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

1:疑问一,为什么计算不用% ,而是这么写的  i = (n - 1) & hash

今天重点:为什么 hash & (n - 1) = hash % n ??

3556516 转化成二进制是 11 0110 0100 0100 1010 0100

3556516 & 7 结果是,二进制的后三位

3556516 % 8结果也是,二进制的后三位

先说说 3556516 & 7 =二进制的后三位

 

7=23-1,二进制,最后三位是1,其余全部是0(前面说过,n是2的次方,n-1的二进制一定满足,后面全是1,前面全是0)

& 运算的性质,两者同是1得1,否则得0,

那细想下,3556516 & 7,得到的不就是3556516的二进制的后三位么。这个不懂仔细想想,画画。

至此,3556516 & 7 结果是,二进制的后三位这个就讲完了,

即 3556516 & 7= 4(也就是3556516 二进制的最后三位100)

再说说3556516 % 8=二进制的后三位
先看这两个式子

 

 

这两个式子,相信大家应该能看懂,20 % 8,把20分成两部分,一部分能整除8,另一部分小于8,肯定就是余数了。

20的二进制 = 10100

二进制转化十进行是这么计算的

10100 = 1 * 24 + 0 * 23 + 1 * 22 + 0 * 21 + 0 * 20 = (1 * 24 + 0 * 23) + (1 * 22 + 0 * 21 + 0 * 20)

20 % 8 = (16 + 4)% 8 = 4 如果这个你懂了的话,上面那上二进制的式子中,第一个括号里的肯定能被8整除,第二个括号里的就是余数。

即:20 % 8 = 二进制10100的后三位。3556516 % 8=二进制的后三位是一个道理。

好了,费了这么大的劲儿,终于解释了

hash & (n - 1) = hash % n

为什么用hash & (n - 1) ,而不是用 hash % n
HashMap 中的哈希函数 hash & (n - 1) 跟取余运算 hash % n 结果是一致的。那它为什么不直接用取余运算呢?

答案两个字——性能。
————————————————

原文链接

2:疑问二,hash(Object key)原理,为什么(hashcode >>> 16)

由于和(length-1)运算,length 绝大多数情况小于2的16次方。所以始终是hashcode 的低16位(甚至更低)参与运算。要是高16位也参与运算,会让得到的下标更加散列。

所以这样高16位是用不到的,如何让高16也参与运算呢。所以才有hash(Object key)方法。让他的hashCode()和自己的高16位^运算。

所以(h >>> 16)得到他的高16位与hashCode()进行^运算

为什么用^而不用&和|

因为&和|都会使得结果偏向0或者1 ,并不是均匀的概念,所以用^。

这就是为什么有hash(Object key)的原因。

补充一些 为什么0和1结果用^ 更均匀

  1. 0000 0100 1011 0011 1101 1111 1110 0001
  2.  >>> 16
  3. 0000 0000 0000 0000 0000 0100 1011 0011

hashcode为int类型,4个字节32位,为了确保散列性,肯定是32位都能进行散列算法计算是最好的。

首先要明白,为什么用亦或计算,二进制位计算,a 只可能为0,1,b只可能为0,1。a中0出现几率为1/2,1也是1/2,b同理。

位运算符有三种,|,&,……,或,与,亦或。 a,b进行位运算,有4种可能 00,01,10,11 a或b计算 结果为1的几率为3/4,0的几率为1/4 a与b计算 结果为0的几率为3/4,1的几率为1/4, a亦或b计算 结果为1的几率为1/2,0的几率为1/2 所以,进行亦或计算,得到的结果肯定更为平均,不会偏向0或者偏向1,更为散列。

右移16位进行亦或计算,我将其拆分为两部分,前16位的亦或运算,和后16位的亦或运算, 后16位的亦或运算,即原hashcode后16位与原hashcode前16位进行亦或计算,得出的结果,前16位和后16位都有参与其中,保证了 32位全部进行计算。 前16位的亦或运算,即原hasecode前16位与0000 0000 0000 0000进行亦或计算,结果只与前16位hashcode有关,同时亦或计算,保证 结果为0的几率为1/2,1的几率为1/2,也是平均的。

所以为什么是右移16位,个人觉得博主说的原因是一部分, 也有一个原因是右移16位进行亦或计算的结果中, (1)结果的后16位保证了hashcode32位全部参与计算,也保证了0,1平均,散列性 (2)结果的前16位保证hashcode前16位了0,1平均散列性,附带hashcode前16位参与计算。 (3) 16与16位数相同,利于计算,不需要补齐,移去位数数据 更多情况,hashmap只会用到前16位(临时数据一般不会这么大),所以(1)占主因


原文链接

posted @ 2021-09-28 14:35  _Phoenix  阅读(95)  评论(0编辑  收藏  举报