HashMap 使用的时候指定容量?你真的用明白了吗?(值得一阅)

前言

其实可以看到我写了这么久的博客,很少去写hashMap的东西。

为什么? 因为这个东西感觉是java面试必备的,我感觉大家都看到腻了,所以一直没怎么去写hashMap相关的。


ps: 之前整理过一个hashmap存值的流程图,感觉够了,因为put过程基本可以把所有核心点都过一遍。JAVA jdk1.8 HashMap 存值流程图解_小目标青年的博客-CSDN博客

今天为什么我突然要来写这一篇文章,因为最近在公司看一些老项目代码,我才发现原来其实很多人都没用对。

本篇内容:

举例说明 HashMap 使用的时候指定容量 错误用法;

源码走读,HashMap初始容量的 计算方式;

源码走读扩容的点;

正确应该怎么去用,一定要理解再用;

一些杂谈。

正文

不开玩笑,真的都知道指定容量,但是有些用对了,有些没用对。

 

为什么要指定容量?

这个原由,都不用说,阿里的java开发手册就说的很明白:


 其实核心点,就是避免数据量慢慢增加,导致反复触发扩容,影响性能。

于是乎就很多错误的使用方式了(虽热影响不大):

 

错误理解使用示例 ① :

分页查询出来的数据,需要转换成 Map, 因为分页是固定了一页最多15条。
所以出现了这个代码:

Map<String, String> map = new HashMap<>(15);

或者是 

Map<String, String> map = new HashMap<>(userPageList.size());


错误理解使用示例 ② :

类型type 有 4种, 要放到一个map里面,返回去。

所以出现了这个代码:

Map<Integer, String> map = new HashMap<>(4);


错误理解使用示例 ③:

一个参数map,里面想放2个参数。

所以出现了这个代码:
Map<String, String> map = new HashMap<>(2);
 

不多举例,其实这几个错误示例,都是错在指定容量的 值上。

默认 指定是 传入 16, 16* 0.75=12 , 所以扩容阈值是12 。

说到这里,大家应该知道为什么上面是错误用法了吧?

比如我们想 存 4个元素到Map, 我们为了避免后面触发扩容影响性能(其实元素少性能没多少影响), 就指定了 4 :

Map<Integer, String> map = new HashMap<>(4);

其实这样 4x0.75= 3 ,那么如果存放第四个元素的时候,就会触发扩容

JAVA jdk1.8 HashMap 存值流程图解_小目标青年的博客-CSDN博客

 这样就是违背了我们开始指定 的 4 的最初用意。

实战看看这个错误使用场景的情况:
 

同过反射,将capacity属性的权限拿到,可以直接打印出来看下capacity的变化,就知道是否触发了扩容:

    public static void main(String[] args) throws NoSuchMethodException, InvocationTargetException, IllegalAccessException {

        Map<String, String> map = new HashMap<>(4);
        Class<?> mapType = map.getClass();
        Method capacity = mapType.getDeclaredMethod("capacity");
        capacity.setAccessible(true);

        map.put("1", "第一个元素插入");
        System.out.println("capacity : " + capacity.invoke(map) + "    size : " + map.size());
        map.put("2", "第二个元素插入");
        System.out.println("capacity : " + capacity.invoke(map) + "    size : " + map.size());
        map.put("3", "第三个元素插入");
        System.out.println("capacity : " + capacity.invoke(map) + "    size : " + map.size());
        map.put("4", "第四个元素插入");
        System.out.println("capacity : " + capacity.invoke(map) + "    size : " + map.size());

    }

看下打印效果: 

为什么,当size =3 ,也就是插入三个元素的时候还没变。 


因为我们初始化容量值传入的 4,  4* 0.75 =3. 扩容阈值是 3!  

当插入第四个元素的时候, 就超过了扩容阈值,所以触发了扩容,所以看的最后其实是进行了一次扩容,打印出来的capacity是 8.

那么我们应该传多少?

4/0.75  + 1 = 6.3333333

我们指定传6么? 还是传 7 ?

指定6:

指定7:

指定6,7 都没区别好像, 值得庆祝的是,没有再次触发扩容。

那么为啥没区别呢?

HashMap会转换成大于该capacity 的第一个2的幂作为容量 。

所以传5,6,7,8 都是 8 ;

传9,10,11,12,13,14,15,16 都是 16 ;
 

好了不多啰嗦了, 最后再补一嘴, 默认指定容量,其实就是 内存换性能。

所以真正去使用指定容量的时候, 需要考虑,

如果我是一个定时任务,允许跑1小时。。。 我需要考虑性能么? 

或者如果我服务内存很小,我是不是要对内存省吃俭用?

posted on 2022-11-08 07:33  小目标青年  阅读(58)  评论(0编辑  收藏  举报