【JVM】-NO.110.JVM.1 -【JDK11 HashMap详解】

Style：Mac

Series：Java

Since：2018-09-10

End：2018-09-10

Total Hours：1

Degree Of Diffculty：5

Degree Of Mastery：5

Practical Level：5

Desired Goal：5

Archieve Goal：3

Gerneral Evaluation：3

Writer:kingdelee

Related Links：

http://www.cnblogs.com/kingdelee/

http://www.runoob.com/java/java-operators.html

1.传入自定义容量的值，会经过下面算法进行计算，最终生成一个结果为稍稍大于传入值且小于 2的n次幂的数，以下这个是jdk10的

static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

jdk11的是：

static final int tableSizeFor(int cap) {
        int n = -1 >>> Integer.numberOfLeadingZeros(cap - 1);
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }


在Integer里边
    @HotSpotIntrinsicCandidate
    public static int numberOfLeadingZeros(int i) {
        // HD, Count leading 0's
        if (i <= 0)
            return i == 0 ? 32 : 0;
        int n = 31;
        if (i >= 1 << 16) { n -= 16; i >>>= 16; }
        if (i >= 1 <<  8) { n -=  8; i >>>=  8; }
        if (i >= 1 <<  4) { n -=  4; i >>>=  4; }
        if (i >= 1 <<  2) { n -=  2; i >>>=  2; }
        return n - (i >>> 1);
    }

2.关键词

hash

2.1 hash算法

执行put时

   private int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

putval

if ((p = tab[i = (n - 1) & hash]) == null)  // i: (16-1) & 10 = 10，未存在节点的情况下，让新节点P指向数组节点tab中的hash后的节点，创建节点数组；已经存在节点时不再进来；n是tab的长度
        {
            logger.info("创建一个新节点，tab["+i+"]指向这个节点" + "hash:" + hash + ",value:" + value);
            tab[i] = newNode(hash, key, value, null);   // 仅在p节点为空的情况下，创建刚刚新节点指向hash后为空的节点的位置
        }

以上完成了，将创建的新节点，赋给横向的数组tab中的某个槽位，槽位

解释hash算法：

hash = (h = key.hashCode()) ^ (h >>> 16)

00000000000000000000000001100100	100的2进制
00000000000000000000000000000000    100右移16位，明显为0
00000000000000000000000001100100	^异或运算，只要a != b 就为1，否则为0；即结果仍为a

(n-1) & hash，n是tab的长度，初始为16
即 15 & hash

00000000000000000000000000001111	15的2进制
00000000000000000000000001100100	hash为100时的2进制
00000000000000000000000000000100	&与运算，a=b=1 就为1，否则为0；结果是4

00000000000000000000000000001111	15的2进制
00000000000000000000000001100101	hash为101时的2进制
00000000000000000000000000000101	&与运算，a=b=1 就为1，否则为0；结果是5

00000000000000000000000000001111	15的2进制
00000000000000000000000001100110	hash为102时的2进制
00000000000000000000000000000110	&与运算，a=b=1 就为1，否则为0；结果是6

（正顺序定义为从右往左数，首位为0）发现，a的第4位为0，即无论b是什么数，第4位往后是什么都无意义与运算结果总是为0.
所以只看前3位，即结果一定是在a范围内的。
结果似乎是散列无碰撞的

如果长度是17呢？
即 16 & hash

00000000000000000000000000010000	16的2进制
00000000000000000000000001100100	hash为100时的2进制
00000000000000000000000000000000	&与运算，a=b=1 就为1，否则为0；结果是0

00000000000000000000000000000000	16的2进制
00000000000000000000000001100101	hash为101时的2进制
00000000000000000000000000000000	&与运算，a=b=1 就为1，否则为0；结果是0

00000000000000000000000000000000	16的2进制
00000000000000000000000001100110	hash为102时的2进制
00000000000000000000000000000000	&与运算，a=b=1 就为1，否则为0；结果是0

结果都是0，都往一个坑里跳了

看一下代码，如果有100-200的hash值，在长度为16和17的情况下的槽位输出

int len = 16;

        List<Integer> list = new ArrayList<>();
        List<Integer> resultList = new ArrayList<>();
        for (int i = 100; i < 200; i++) {
            list.add(i);
        }

        for (Integer i : list) {
            resultList.add((i ^ (i >> 16)) & (len - 1));
        }
        System.out.println(resultList.toString());

输出：
[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7]

当 len = 17 时
输出：
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 16, 0, 0, 0, 0, 0, 0, 0, 0]

1.对于 hash()的算法中，(h ^ h>>16)

发现，只要是在hashcode的位数小于等于16位，右移后都会被清空，即h>>6结果总是为0。

对于任意一个h^0，结果都是h

明显发现17时，这个算法的散列能力很差，绝大多数的数仅分布在两个不一样的槽里。

观察发现，只有当a的二进制数值都为1111，或者11111，或者111111....这样的情况下，与b进行&运算时，结果才能依次递增，即结果数据非常松散有规律的递增

而1111，11111，111111这样对应的是十进制的15，31，63，也即是16-1，32-1，64-1，也即是2^4-1, 2^5-1, 2^6-1，都是2的次幂-1

综上原理结论：

1.该算法通过与tab的len长度(n-1)进行&运算，结果result一定是 result<len；即一定在长度内不会越界。

2.该算法只有在len=2的n次幂的情况下，散列能力才正常松散，否则，散列能力会很差，值都会放同一个槽(坑)里跳。

应用结论：

给hashmap指定长度时，一定要指定为2的n次幂。

2.put的时候，key是如何判断是否相同的？

Node<K,V> e; K k;
            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))){
                e = p;  // hash相等 && key相等 的情况下，用节点e存储原来的已经存在的节点k
                logger.info("相同对象");
            }

结论：

当且仅当，　　

h >>> 16

posted @ 2018-10-08 05:04 kingdelee 阅读(258) 评论(0) 收藏举报

刷新页面返回顶部

【JVM】-NO.110.JVM.1 -【JDK11 HashMap详解】

公告