[Java]HashMap与ConcurrentHashMap的一些总结

HashMap与ConcurrentHashMap的一些总结

HashMap底层数据结构

JDK7:数组+链表

JDK8:数组+链表+红黑树

JDK8中的HashMap什么时候将链表转为红黑树?

当发现链表中的元素大于8之后,判断当前数组长度,如果数组长度小于64并不会马上转为红黑树,而是进行扩容。因为如果数组长度还比较小,就先利用扩容来缩小链表的长度。只有当链表中元素个数大于8,且数组长度大于64时才会将链表转为红黑树。

JDK8中的HashMap为什么要使用红黑树?

HashMap中,当元素的个数小于8时,链表的插入查询效率高于红黑树;当元素的个数大于8时,链表的插入查询效率小于红黑树。

JDK8中的HashMap的put方法的实现过程

  • 根据key生成hashcode
  • 判断当前HashMap对象中的数组是否为空,如果是空则对数组进行初始化
  • 根据逻辑与运算,算出hashcode基于当前数组对应的数组下标i
  • 判断数组中第i个位置的元素(以下称为tab[i])是否为空
    • 如果是空的,则将key-value值封装为Node对象赋值给 tab[i]
    • 如果不是空的,判断put传入的key是否等于 tab[i].key
      • 如果等于那么说明存在相同key
      • 如果不等,判断tab[i]的类型:
        • tab[i]的类型为TreeNode,表示第i个位置上的是红黑树,那么就将key-value值插入到红黑树中,并且在插入之前判断红黑树中是否存在相同key
        • tab[i]的类型不是TreeNode,表示第i个位置上的是链表,那么遍历链表查看是否有相同key,并在遍历过程中对链表的节点数进行计数,当遍历到最后一个节点时将key-value封装为Node插入链表尾部,同时判断插入新节点之前的链表节点个数是否大于8,如果是,则将链表改为红黑树
    • 如果上述步骤发现存在相同key,则根据onlyIfAbsent标记来判断是否需要更新value值,然后返回oldValue
  • modCount++
  • HashMap的元素个数size加1
  • 如果size大于扩容的阈值, 则进行扩容

JDK8中的HashMap的get方法实现过程

  • 根据key生成hashcode
  • 如果数组为空,则直接返回空
  • 如果数组不为空,则利用hashcode和数组长度通过逻辑与操作算出key所对应的数组下标i
  • 如果数组的第i个位置上没有元素,则直接返回空
  • 如果数组的第1个位上的元素的key等于get方法所传进来的key, 则返回该元素,并获取该元素的value
  • 如果不等于则判断该元素还有没有下一个元素,如果没有,返回空
  • 如果有则判断该元素的类型是链表结点还是红黑树结点
  • 如果是链表则遍历链表
  • 如果是红黑树则遍历红黑树
  • 找到即返回元素,没找到的则返回空

JDK7和JDK8中的HashMap的不同点

  • 8中使用了红黑树
  • 7中的链表使用的是头插法,8中链表使用的是尾插法
  • 7中的Hash算法比比8中的更复杂。Hash算法更复杂生成的hashcode更散列,查询性能更好,但是性能越低。8中因为使用了红黑树使性能得到了保障所以简化了Hash算法。
  • 扩容过程中7有可能对key重新进行哈希,但是8没有这个逻辑
  • 8的扩容条件和7的扩容条件不同
  • 8中多了一个APIputIfAbsent(key ,value)
  • 7和8的扩容过程中转移元素的逻辑不同

JDK7中的ConcurrentHashMap是怎么保证并发安全

主要利用Unsafe操作 + ReentrantLock+分段思想。分段数越高则支持的最大并发量越高。

ConcurrentHashMap的内部类Segment就是用来表示某一个段的。

每个Segment就是一个小型的HashMap的, 当调用ConcurrentHashMapput方法是,最终会调用到Segmentput方法,而Segment类继承了ReentrantLock,所以Segment自带可重入锁,当调用到Segmentput方法时,会先利用可重入锁加锁, 加锁成功后再将待插入的key,value插入到小型HashMap中,插入完成后解锁。

JDK7中的ConcurrentHashMap的底层原理

ConcurrentHashMap底层是由两层嵌套数组来实现的:

  • ConcurrentHashMap对象中有一个属性segments, 类型为Segment[];
  • Segment对象中有一个属性table,类型为HashEntry[];当调用ConcurrentHashMapput方法时,先根据key计算出对应的Segment[]的数组下标j,确定好当前key,value应该插入到哪个Segment对象中,如果segments[j]为空,则利用自旋锁的方式在j位置生成一个 Segment对象。然后调用Segment对象的put方法。Segment对象的put方法会先加锁, 然后也根据key计算出对应的HashEntry[]的数组下标i,然后将 key,value封装为HashEntry对象放入该位置,此过程和JDK7HashMapput方法一样,然后解锁。在加锁的过程中逻辑比较复杂,先通过自旋加锁,如果超过一 定次数就会直接阻塞等等加锁。

JDK8中的ConcurrentHashMap是怎么保证并发安全

主要利用Unsafe操作 + synchronized关键字。

Unsafe操作的使用仍然和JDK7中的类似,主要负责并发安全的修改对象的属性或数组某个位置的值。

synchronized主要负责在需要操作某个位置时进行加锁(该位置不为空),比如向某个位置的链表进行插入结点,向某个位置的红黑树插入结点。JDK8中其实仍然有分段锁的思想,只不过JDK7中段数是可以控制的,而JDK8中是数组的每一个位置都有一把锁。
当向ConcurrentHashMapput一个key,value时:

  • 首先根据key计算对应的数组下标i,如果该位置没有元素,则通过自旋的方法去向该位置赋值。
  • 如果该位置有元素,则synchronized会加锁
  • 加锁成功之后, 在判断该元素的类型:
    • 如果是链表节点则进行添加节点到链表中
    • 如果是红黑树则添加节点到红黑树
  • 添加成功后,判断是否需要进行树化
  • addCount,这个方法的意思是ConcurrentHashMap的元素个数加1,但是这个操作也是需要并发安全的,并且元素个数加1成功后,会继续判断是否要进行扩容,如果需要,则会进行扩容,所以这个方法很重要。
  • 同时一个线程在put时如果发现当前ConcurrentHashMap正在进行扩容则会去帮助扩容。

JDK7和JDK8中的ConcurrentHashMap的不同点

  • 首先是包括了HashMap中的不同点
  • JDK8中没有分段锁了, 而是使用synchronized来进行控制
  • JDK8中的扩容性能更高, 支持多线程同时扩容, 实际上JDK7中也支持多线程扩容,因为JDK7中的扩容是针对每个Segment的,所以也可能多线程扩容, 但是性能没有JDK8高, 因为JDK8中对于任意一个线程都可以去帮助扩容
  • JDK8中的元素个数统计的实现也不一 样了,JDK8中增加了CounterCell来帮助计数,而JDK7中没有,JDK7中是put的时候每个Segment内部计数,统计的时候是遍历每个Segment对象加锁统计。
posted @   knqiufan  阅读(43)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示
欢迎阅读『[Java]HashMap与ConcurrentHashMap的一些总结』