Java8中HashMap扩容算法小计
Java8的HashMap扩容过程主要就是集中在resize()方法中
1 final Node<K,V>[] resize() { 2 // ...省略不重要的 3 }
其中,当HashMap扩容完毕之后,需要对原有的数据进行转移。因为容量变大了,部分元素的位置因此要变更,因而出现了下面的这个转移过程。
转移过程大致是:依次从旧数组里取值,然后从该值对应的链表上依次取出节点,对节点取模分别放入lo链表和hi链表,当链表中节点遍历完后,分别把lo链表和hi链表放入新数组的不同位置。
在看到如下第15行时,我在想,为什么(e.hash & oldCap)== 0时就放入lo链表,否则就是hi链表?
说到这个问题,那我们就要回顾下HashMap存入新元素的过程了。看下面的第45行,可以发现插入时是使用(n - 1) & hash来计算位置的,即数组长度-1,而扩容移位是使用数组长度n计算的,那这是为什么呢?
1 for (int j = 0; j < oldCap; ++j) { 2 Node<K,V> e; 3 if ((e = oldTab[j]) != null) { 4 oldTab[j] = null; 5 if (e.next == null) 6 newTab[e.hash & (newCap - 1)] = e; 7 else if (e instanceof TreeNode) 8 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); 9 else { // preserve order 10 Node<K,V> loHead = null, loTail = null; 11 Node<K,V> hiHead = null, hiTail = null; 12 Node<K,V> next; 13 do { 14 next = e.next; 15 if ((e.hash & oldCap) == 0) { 16 if (loTail == null) 17 loHead = e; 18 else 19 loTail.next = e; 20 loTail = e; 21 } 22 else { 23 if (hiTail == null) 24 hiHead = e; 25 else 26 hiTail.next = e; 27 hiTail = e; 28 } 29 } while ((e = next) != null); 30 if (loTail != null) { 31 loTail.next = null; 32 newTab[j] = loHead; 33 } 34 if (hiTail != null) { 35 hiTail.next = null; 36 newTab[j + oldCap] = hiHead; 37 } 38 } 39 } 40 } 41 42 43 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { 44 // ...省略不重要的 45 if ((p = tab[i = (n - 1) & hash]) == null) 46 tab[i] = newNode(hash, key, value, null); 47 else { 48 // ...省略不重要的 49 }
像我们看Java8的HashMap源码,应该都应该知道HashMap的底层数组长度都是2的n方的值
那么我们就假设一个底层数组长度为8的HashMap模拟进行插入元素和扩容移位的过程
长度n=8 ----> 0x1000
n-1 ----> 0x0111
此时写入两个元素,两个元素的hash值分别为hash1 = 0x0101,hash2 = 0x1101
hash1 & n-1 = 0x0101
hash2 & n-1 = 0x0101
两个hash取模后的结果是一致的,所以它们会在同一个地方组成链表
那么此时如果要进行扩容移位呢?
hash1 & n = 0x0000
hash2 & n = 0x1000
此时两者的结果是不一样的,并且相差0x1000即10进制的8即数组长度.。
所以这也就是为什么上图15行只判断==0的原因,因为这个取模结果只有0和1两种值(数组长度是2的n次方,只有除了符号位外的最高位为1)
而两个取模结果等于数组长度,这也就是为什么上图第32和36行那么处理的原因。