HashMap 底层分析

以下基于 JDK1.7 分析

如图所示,HashMap底层是基于数组和链表实现的,其中有两个重要的参数:

---容量

---负载因子

容量的默认大小是16,负载因子是0.75,当HashMap的size > 16* 0.75时就会发生扩容(容量和负载因子都可以自由调整)

put方法

首先会将传入的key做hash运算计算出hashcode,然后根据数组长度取模计算出在数组中的index下标

由于在计算中位运算比取模运算效率高的多,所以HashMap规定数组的长度为2^n,这样用2^n -1做位运算与取模效果一致,并且效率还要高处许多。

由于数组的长度有限,所以难免会出现不同的key通过运算得到的index相同,这种情况可以利用链表来解决,HashMap会在table[index]处形成链表,采用头插法将数据插入到链表中。

get方法

get和put类似,也是将传入的key计算出index,如果该位置上是一个链表就需要遍历整个链表,通过key.equals(k)来找到对应的元素。

 Iterator<Map.Entry<String, Integer>> entryIterator = map.entrySet().iterator();
        while (entryIterator.hasNext()) {
            Map.Entry<String, Integer> next = entryIterator.next();
            System.out.println("key=" + next.getKey() + " value=" + next.getValue());
        }

 

Iterator<String> iterator = map.keySet().iterator();
        while (iterator.hasNext()){
            String key = iterator.next();
            System.out.println("key=" + key + " value=" + map.get(key));

        }

 

map.forEach((key,value)->{
    System.out.println("key=" + key + " value=" + value);
});

 

强烈建议使用第一种 EntrySet 进行遍历。

第一种可以把 key value 同时取出,第二种还得需要通过 key 取一次 value,效率较低, 第三种需要 JDK1.8 以上,通过外层遍历 table,内层遍历链表或红黑树。

notice

在并发环境下HashMap容易出现死循环

并发场景发生扩容,调用resize()方法里的rehash()时,容易出现环形链表,这样当获取一个不存在的key时,计算出的index正好是环形链表的下标时就会出现死循环。

所以 HashMap 只能在单线程中使用,并且尽量的预设容量,尽可能的减少扩容。

 

在 JDK1.8 中对 HashMap 进行了优化: 当 hash 碰撞之后写入链表的长度超过了阈值(默认为8),链表将会转换为红黑树

 

假设 hash 冲突非常严重,一个数组后面接了很长的链表,此时重新的时间复杂度就是 O(n) 。

 

如果是红黑树,时间复杂度就是 O(logn) 。

 

大大提高了查询效率。

 

posted @ 2018-09-18 16:04  提拉没有米苏  阅读(157)  评论(0编辑  收藏  举报