HashMap底层结构、扩容机制实战探索

作者专注于Java、架构、Linux、小程序、爬虫、自动化等技术。工作期间含泪整理出一些资料，微信搜索【javaUp】，回复【java】【黑客】【爬虫】【小程序】【面试】等关键字免费获取资料。技术交流、项目合作可私聊。微信：shuhao-99999

1.存储结构

从结构上，HashMap是由 数组+链表+红黑树（JDK1.8增加了红黑树部分） 实现的。

下图中，每一个黑色原点代表一个键值对（Node，实现了Map.Entry）,table的默认长度是16；

JDK1.8引入了红黑树，链表长度大于8时转化为红黑树，极大地优化了HashMap的性能

2.获取hash数组索引位置

实质上有3步：取key的hashcode值，高位运算、取模运算

取模运算是JDK7里面的，JDK8没有这个运算方法：

h & (length - 1)

3.hash碰撞

有时候，如果2个key定位到了相同的位置，表示发生了hash碰撞

4.扩容机制（如何减少hash碰撞的概率）

想要减少hash碰撞，就要在键值对达到一定数量的时候，进行hash运算和扩容；

threshold是HashMap所能容纳的最大键值对（Node）数量，计算方式：

threshold = length * （1+loadFactor）

其中，

length是table的默认长度，值为16；

loadFactor是负载因子，默认值为0.75；

也就是说，初始化一个HashMap的时候，HashMap的极限值threshold的默认长度是16 * 1.75 = 12。从下图也可以看出来确实是12！

如上图所示，当前键值对已经达到极限值12，再向map中添加一个键值对之后，就要扩容了。

扩容后的length是原来length的2倍！

5. 设置HashMap的初始大小和负载因子

HashMap有一个构造方法可以设置初始大小和负载因子：HashMap(int initialCapacity, float loadFactor)

当然，也有一个构造方法HashMap(int initialCapacity)，只设置初始大小，实际上也是调用了上面的构造方法：

扩容是一个非常消耗性能的操作，所以如果我们已经预知 hashmap 中元素的个数，那么预设元素的个数能够有效的提高hashmap 的性能。比如说，我们有 1000 个元素 new HashMap(1000), 但是理论上来讲 new HashMap(1024) 更合适，不过上面 annegu 已经说过，即使是 1000，hashmap 也自动会将其设置为 1024。但是 new HashMap(1024) 还不是更合适的，因为0.75*1000 < 1000, 也就是说为了让 0.75 * length > 1000（length是table的长度），我们必须这样 new HashMap(2048) 才最合适，既考虑了 & 的问题，也避免了 resize的问题。

6.一般用什么作为HashMap的key?

一般用Integer、String这种不可变类当HashMap当key，而且String最为常用。选择Integer，String这种不可变的类型，像对String的一切操作都是新建一个String对象，对新的对象进行拼接分割等，这些类已经很规范的覆写了hashCode()以及equals()方法。作为不可变类天生是线程安全的