HashMap 使用的时候指定容量?你真的用明白了吗?(值得一阅)
前言
其实可以看到我写了这么久的博客,很少去写hashMap的东西。
为什么? 因为这个东西感觉是java面试必备的,我感觉大家都看到腻了,所以一直没怎么去写hashMap相关的。
ps: 之前整理过一个hashmap存值的流程图,感觉够了,因为put过程基本可以把所有核心点都过一遍。JAVA jdk1.8 HashMap 存值流程图解_小目标青年的博客-CSDN博客
今天为什么我突然要来写这一篇文章,因为最近在公司看一些老项目代码,我才发现原来其实很多人都没用对。
本篇内容:
举例说明 HashMap 使用的时候指定容量 错误用法;
源码走读,HashMap初始容量的 计算方式;
源码走读扩容的点;
正确应该怎么去用,一定要理解再用;
一些杂谈。
正文
不开玩笑,真的都知道指定容量,但是有些用对了,有些没用对。
为什么要指定容量?
这个原由,都不用说,阿里的java开发手册就说的很明白:
其实核心点,就是避免数据量慢慢增加,导致反复触发扩容,影响性能。
于是乎就很多错误的使用方式了(虽热影响不大):
错误理解使用示例 ① :
分页查询出来的数据,需要转换成 Map, 因为分页是固定了一页最多15条。
所以出现了这个代码:
Map<String, String> map = new HashMap<>(15);
或者是
Map<String, String> map = new HashMap<>(userPageList.size());
错误理解使用示例 ② :
类型type 有 4种, 要放到一个map里面,返回去。
所以出现了这个代码:
Map<Integer, String> map = new HashMap<>(4);
错误理解使用示例 ③:
一个参数map,里面想放2个参数。
所以出现了这个代码:
Map<String, String> map = new HashMap<>(2);
不多举例,其实这几个错误示例,都是错在指定容量的 值上。
默认 指定是 传入 16, 16* 0.75=12 , 所以扩容阈值是12 。
说到这里,大家应该知道为什么上面是错误用法了吧?
比如我们想 存 4个元素到Map, 我们为了避免后面触发扩容影响性能(其实元素少性能没多少影响), 就指定了 4 :
Map<Integer, String> map = new HashMap<>(4);
其实这样 4x0.75= 3 ,那么如果存放第四个元素的时候,就会触发扩容
(JAVA jdk1.8 HashMap 存值流程图解_小目标青年的博客-CSDN博客)
这样就是违背了我们开始指定 的 4 的最初用意。
实战看看这个错误使用场景的情况:
同过反射,将capacity属性的权限拿到,可以直接打印出来看下capacity的变化,就知道是否触发了扩容:
public static void main(String[] args) throws NoSuchMethodException, InvocationTargetException, IllegalAccessException {
Map<String, String> map = new HashMap<>(4);
Class<?> mapType = map.getClass();
Method capacity = mapType.getDeclaredMethod("capacity");
capacity.setAccessible(true);
map.put("1", "第一个元素插入");
System.out.println("capacity : " + capacity.invoke(map) + " size : " + map.size());
map.put("2", "第二个元素插入");
System.out.println("capacity : " + capacity.invoke(map) + " size : " + map.size());
map.put("3", "第三个元素插入");
System.out.println("capacity : " + capacity.invoke(map) + " size : " + map.size());
map.put("4", "第四个元素插入");
System.out.println("capacity : " + capacity.invoke(map) + " size : " + map.size());
}
看下打印效果:
为什么,当size =3 ,也就是插入三个元素的时候还没变。
因为我们初始化容量值传入的 4, 4* 0.75 =3. 扩容阈值是 3!
当插入第四个元素的时候, 就超过了扩容阈值,所以触发了扩容,所以看的最后其实是进行了一次扩容,打印出来的capacity是 8.
那么我们应该传多少?
4/0.75 + 1 = 6.3333333
我们指定传6么? 还是传 7 ?
指定6:
指定7:
指定6,7 都没区别好像, 值得庆祝的是,没有再次触发扩容。
那么为啥没区别呢?
HashMap会转换成大于该capacity 的第一个2的幂作为容量 。
所以传5,6,7,8 都是 8 ;
传9,10,11,12,13,14,15,16 都是 16 ;
好了不多啰嗦了, 最后再补一嘴, 默认指定容量,其实就是 内存换性能。
所以真正去使用指定容量的时候, 需要考虑,
如果我是一个定时任务,允许跑1小时。。。 我需要考虑性能么?
或者如果我服务内存很小,我是不是要对内存省吃俭用?