50、分段加锁

内容来自王争 Java 编程之美

HashMap 是在开发中经常用到的容器，但是它不是线程安全的，只能应用于单线程环境下
在多线程环境下，Java 提供了线程安全的 HashTable、SynchronizedMap，但是两者因为采用粗粒度锁来实现，并发性能不佳
于是 JUC 便开发了 ConcurrentHashMap，利用分段加锁等技术来提高并发性能，本节我们就来详细讲解一下 ConcurrentHashMap 的实现原理，这也是面试中经常被问到的地方

这里特别声明一下，HashMap 和 ConcurrentHashMap 在 JDK 7 和 JDK 8 中的实现方式均有较大差别，在本节中我们参照 JDK 8 中的实现方式来讲解

1、HashMap 线程不安全分析

在讲解 ConcurrentHashMap 之前，我们先要搞清楚，为什么 HashMap 是非线程安全的？
前面讲到，线程安全问题产生的原因是竞态读写共享资源，对于 HashMap 来说，共享资源就是 table 数组及其 table 数组中的链表
HashMap 提供的读写函数有很多，我们拿 get()、put() 这两个常用的函数来分析

get() 函数包含读操作
put() 函数除了包含写操作之外，还包含两个操作：扩容和树化

因此接下来，我们就通过分析：读、写、扩容、树化这 4 个操作之间竞态执行的线程安全性，以此来分析 HashMap 的线程安全性

1、读操作与读操作、写操作、扩容、树化之间是否线程安全？

读操作和读操作之间显然不存在线程安全问题
读操作和写操作之间也不存在线程安全问题：写操作将数据添加到 table 数组中对应的链表的尾部，读操作从头遍历链表，两者并不冲突

读操作和扩容之间存在线程安全问题，扩容的大致处理流程如下代码所示，在进行扩容时

HashMap 会申请一个新的 table 数组，HashMap 会先更新 table 引用指向新的 table 数组（newTable）
然后再将旧的 table 数组（oldTable）中的链表节点一点一点搬移到新的 table 数组（newTable）
读操作一直在 table 引用所指向的 table 数组上进行，这就会导致在扩容初期某些数据还没来得及搬移到新的 table 数组而无法读取到
当然 HashMap 也可以先搬移数据，再更新 table 引用，但这仍然无法解决线程安全问题

 public class HashMap {
 
    private Node<K, V>[] table; // table 引用
 
    public resize() {
        Node<K, V>[] oldTable = this.table;
        Node<K, V>[] newTable = new Node<K, V>[table.length * 2];
        this.table = newTable; // 先更新 table 引用
        // 然后再将 oldTable 中的数据一点一点搬移到 newTable
        for (int i = 0; i < oldTable.length; ++i) {
            // ...
        }
    }
}

读操作与树化之间不存在线程安全问题

因为链表中的节点定义和红黑树中的节点定义并不相同，所以在执行树化时，HashMap 无法将链表中的节点直接搬移到红黑树中
而是采用复制而非搬移的实现方式，重新创建新的红黑树节点，将链表中的 key、value 等数据复制到新创建的红黑树节点
然后再将红黑树节点添加到红黑树中
跟扩容还有一个不同的地方是，HashMap 在红黑树构建完成之后，才将 table 数组中的引用更新指向红黑树
因此树化是一个标准的写时复制操作，读操作和树化之间互不影响

2、写操作与写操作、扩容、树化之间是否线程安全？

写操作和写操作之间存在线程安全问题，写操作实际上就是执行链表尾插
在第 40 节讲解 CAS 操作时，我们拿 AQS 中的等待队列举例，详细讲解了为什么链表尾插是线程不安全的
尽管 HashMap 中的链表是单链表，AQS 等待队列中的链表为双向链表，但是两者尾插线程不安全的原因是一样的，这里就不再赘述了

因为扩容是先更新 table 引用再搬移数据，所以扩容和写入实际上都是往新的 table 数组中添加数据，就相当于并行执行写操作
而刚刚讲到写操作与写操作是存在线程安全问题的，因此写操作和扩容之间也存在线程安全问题

写操作和树化之间存在线程安全问题
在树化时进行写入操作，在红黑树构建完成之后，但是 table 数组中的引用还没来得及更新前，这时执行写操作，就导致写入的数据无法搬移到红黑树中，而导致写操作无效

3、扩容与扩容、树化操作之间是否线程安全？

扩容与扩容之间存在线程安全问题
根据上述给出的 resize() 扩容函数的大致代码实现，我们得知
扩容过程先更新 table 引用指向新创建的 table 数组（newTable），然后将老的 table 数组（oldTable）中的数据搬移到新的 table 数组（newTable）
两个线程同时执行扩容操作，会争抢搬移老的 table 数组中的链表节点到各自新创建的 table 数组
而最终 table 引用只会指向其中一个新创建的 table 数组，这就导致数据的大量丢失

扩容和树化之间也存在线程安全问题
如果在一个线程执行树化的过程中，另一个线程执行扩容，因为扩容会搬移数据，这就会导致树化操作只能针对链表中的部分数据进行，进而导致数据大量丢失

4、树化与树化之间是否线程安全？

树化通过写时复制来实现
两个树化同时进行只会导致生成两个重复的红黑树，重复更新 table 数组中的引用，并不会引起数据丢失等问题，因此树化与树化之间不存在线程安全问题

5、总结

对读、写、扩容、树化这 4 个操作两两之间的线程安全性分析，我们总结了如下一张表格
从表中我们可以看出，HashMap 在设计实现时完全没考虑线程安全问题，对于 HashMap 中的绝大部分操作，多线程竞态执行都存在问题

是否存在线程安全问题？	读操作	写操作	扩容	树化
读操作	否	否	是	否
写操作	否	是	是	是
扩容	是	是	是	是
树化	否	是	是	否

2、ConcurrentHashMap 介绍

为了解决 HashMap 的线程安全问题，Java 提供了 HashTable 和 SynchronizedMap，JUC 提供了 ConcurrentHashMap

实际上 HashTable 和 SynchronziedMap 在本质上是一样的，都是采用简单粗暴的方式（所有的函数都进行加锁）来解决线程安全问题，因此并发性能欠佳
Java 之所以废弃 HashTable，引入 SynchronizedMap，主要是为了让 JCF 框架的类结构更加清晰
线程安全容器和非线程安全容器分离，线程安全容器通过统一的方式（Collections 的 synchronizedXXX() 方法）来创建

对于 ConcurrentHashMap，我们又可以分为 JDK 7 版本的 ConcurrentHashMap 和 JDK 8 版本的 ConcurrentHashMap，这两个版本的 ConcurrentHashMap 的实现方式有比较大的区别
JDK 8 版本的 ConcurrentHashMap 的分段加锁粒度更小、并发度更高，扩容方式有所不同，size() 函数实现更加高效等等
在本节中，我们仅对 JDK 8 版本的 ConcurrentHashMap 的实现原理做讲解，对于 JDK 7 版本的 ConcurrentHashMap 的实现原理，作为思考题留给你自己来分析

实际上 ConcurrentHashMap 提高并发度的核心方法就是分段加锁，在 HashTable 或 SynchronziedMap 中，table 数组上只有一把锁，所有的读写操作都争抢这一把锁
而在 ConcurrentHashMap 中，table 数组被分段加锁，如果 table 数组的大小为 n，那么就对应存在 n 把锁
table 数组中的每一个链表独享一把锁，不同链表之间的操作可以多线程并行执行，互不影响，以此来提高 ConcurrentHashMap 的并发性能

接下来我们详细讲解一下 ConcurrentHashMap 中的 get()、put()、size() 这几个常用函数的具体实现原理，这其中就包含前面提到的读、写、扩容、树化这 4 个操作

3、get() 函数的实现原理

get() 函数对应的就是读操作，在 get() 函数的代码实现中，我们没有发现任何加锁等线程安全的处理逻辑
因此 get() 函数可以跟任何操作（读操作、写操作、树化、扩容）并行执行，并发性能极高
有句老话说的好：哪有什么岁月静好，只不过是有人替你负重前行
之所以 get() 函数不需要处理线程安全问题，显然是因为其他操作做了特殊处理以兼容并行执行 get() 函数

不过通过以上对 HashMap 的线程安全性分析，我们可以得知
读操作跟写操作、树化操作之间均不存在线程安全问题，读操作只跟扩容操作之间存在线程安全问题，因此 ConcurrentHashMap 中的写操作和树化操作均不需要做特殊处理以兼容并行执行读操作
不过 ConcurrentHashMap 中的扩容操作需要做了一些特殊处理以兼容并行执行读操作，待会在讲解扩容的实现原理时，我们再详细说明

4、put() 函数的实现原理

put() 函数包含三部分逻辑：写操作、扩容、树化，从上述对 HashMap 的线程安全性分析，我们得知：除了树化与树化之间，其他任意两个操作之间均存在线程安全问题
因此为了保证这 3 个操作并行执行的线程安全性，这 3 个操作均使用 synchronized 进行了加锁，接下来我们依次来看下这 3 个操作是如何实现的

4.1、写操作

写操作有两种加锁方式，分别对应链表为空和不为空这两种情况
通过待插入数据的哈希值定位到链表 table[index] 之后

如果链表为空（也就是 table[index] 为 null），那么就通过 CAS 操作将 table[index] 指向写入数据对应的节点
如果链表不为空（也就是 table[index] 不为 null），那么就对链表的头节点（也就是 table[index]）使用 synchronized 加锁，然后再执行写操作

以上处理逻辑对应的代码实现大致如下所示

 public void put(K key, V value) {
    // 1、写操作逻辑
    int index = hash(key) & (table.length - 1);
    if (table[index] == null && cas(table[index], null, new Node(key, value, null))) {
        return; // 写入成功
    }
    synchronzied(table[index]) {
        // 写入逻辑: 遍历链表查看是否存在 key 跟写入数据相同的节点
        // 如果存在, 则更新此节点的 value 值
        // 如果不存在, 则将写入数据对应的节点插入到链表的尾部
    }
 
    // 2、树化逻辑
    // 3、扩容逻辑
}

4.2、树化

在写入操作执行完成之后，如果链表中的节点个数大于等于树化阈值（默认为 8），那么 put() 函数会执行树化操作
前面讲到，尽管树化是写时复制操作，但是在树化的同时执行写入操作或扩容，会导致数据丢失
因此树化操作也需要使用 synchronized 加锁，大致的代码逻辑如下所示

 // 2、树化逻辑
// binCount 为 table[index] 中节点个数, 遍历获得
if (binCount >= TREEIFY_THRESHOLD) {
    synchronized (table[index]) {
        // 树化逻辑: 创建红黑树, 将链表中的数据复制到红黑树, 将 table[index] 指向红黑树
    }
}

4.3、扩容

写操作和树化的加锁逻辑都比较简单，我们再来看下扩容，相对来说，扩容就复杂多了
前面讲到 ConcurrentHashMap 提高并发性能的核心方法是分段加锁，每个链表分别加不同的锁
写操作和树化只针对单个链表操作，因此只需要对单个链表进行加锁，满足分段加锁的设计思路
但是扩容处理的是整个 table 数组中的所有链表，需要对整个 table 数组加锁，是不是就无法分段加锁了呢？

实际上 ConcurrentHashMap 中的扩容操作也是分段加锁分段执行的，接下来我们详细讲解一下 ConcurrentHashMap 的扩容实现原理
实际上为了让扩容兼容读、写、树化操作，允许扩容和读、写、树化操作同时执行而不存在线程安全问题，ConcurrentHashMap 在 HashMap 的基础之上，对扩容逻辑进行了很多改进

使用写时复制

在创建好新的 table 数组之后，ConcurrentHashMap 并非像 HashMap 那样，直接将 table 引用指向新创建的 table 数组
而是采用写时复制的方法，在老的 table 数组中的数据完全复制到新的 table 数组中之后，才将 table 引用指向新创建的 table 数组

复制替代搬移

前面讲到在 HashMap 中，扩容会将老的 table 数组中的节点直接搬移到新的 table 数组中，而在 ConcurrentHashMap 中，扩容是基于复制而非搬移实现的
也就是说：将老的 table 数组中的节点中的 key、value 等数据，复制一份存储在一个新创建的节点中，再将新创建的节点插入到新的 table 数组中

实际上，以上两点改进借鉴的是树化的处理逻辑

扩容操作会针对 table 数组中的每条链表逐一进行复制
在复制某个链表之前，先对这个链表加锁（类似写操作和树化的加锁方式）然后再复制，复制完成之后再解锁
在扩容的过程中，table 数组中会存在三种不同类型的链表：已复制未加锁链表、在复制已加锁链表、未复制未加锁链表，如下图所示

对于未复制未加锁的链表执行读、写、树化操作，以及对于在复制已加锁的链表执行读操作，应该在老的 table 数组中进行的
而对于已复制未加锁的链表执行读、写、树化操作，应该在新的 table 数组中进行
因此在扩容执行的过程中，我们需要对已复制未加锁的链表做标记，当对已标记的链表进行读、写、树化操作时，引导在新创建的 table 数组中执行
那么具体是如何标记某个链表是已复制未加锁的呢？

ConcurrentHashMap 定义了一个新的节点类型：ForwardingNode，代码如下所示
ForwardingNode 继承自 Node，将节点中的 hash 值设置为特殊值 -1，以起到标记的作用

 static final int MOVED = -1; // hash for forwarding nodes
 
// 特殊链表节点定义
static final class ForwardingNode<K, V> extends Node<K, V> {
    final Node<K, V>[] nextTable;
 
    ForwardingNode(Node<K, V>[] tab) {
        super(MOVED, null, null, null);
        this.nextTable = tab;
    }
}
 
// 链表节点定义
static class Node<K, V> implements Map.Entry<K, V> {
    final int hash;
    final K key;
    volatile V val;
    volatile Node<K, V> next;
 
    Node(int hash, K key, V val, Node<K, V> next) {
        this.hash = hash;
        this.key = key;
        this.val = val;
        this.next = next;
    }
}

在扩容的过程中，当某个链表复制完成之后，ConcurrentHashMap 会将这个链表首节点替换为 ForwardingNode 节点，并且将 ForwardingNode 节点中的 nextTable 属性指向新创建的 table 数组
对于空链表，ConcurrentHashMap 会补充一个 key、value 均为 null 的 ForwardingNode 节点，具体如下图所示
当读、写、树化 table 数组中的某个链表时，ConcurrentHashMap 先检查链表首节点的 hash 值
如果 hash 值等于 -1，那么就在这个节点的 nextTable 属性所指向的 table 数组中重新查找对应的链表，再执行读、写、树化操作

上述讲解了 ConcurrentHashMap 如何让扩容可以跟读、写、树化操作并行执行，接下来我们再来看下 ConcurrentHashMap 如何让扩容和扩容并行执行

在 ConcurrentHashMap 中，多个线程可以协作共同完成扩容，每个线程负责相邻的几个链表的复制工作，具体负责哪几个，这就由共享变量 transferIndex 来决定
transferIndex 初始化为 table.length，多个线程通过 CAS 修改 transferIndex 共享变量，如下代码所示
谁成功更新 transferIndex，谁就获取了下标在 [transferIndex - stride, transferIndex) 之间的 stride 个链表的复制权
如果某个线程竞争执行 CAS 失败，则自旋重新执行 CAS
除此之外，某个线程处理完分配的 stride 个链表之后，可以再次自旋执行 CAS 竞争剩余链表的复制权

 public void transfer(Node<K, V>[] tab, Node<K, V> nextTable) {
    int n = tab.length;
    int stride; // 每个线程负责相邻的 stride 个链表
    int NCPU = Runtime.getRuntime().availableProcessors();
    if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
        stride = MIN_TRANSFER_STRIDE; // MIN_TRANSFER_STRIDE = 16
 
    // 循环获取 stride 个链表的处理权并处理, 直到没有剩余的链表要处理
    while (transferIndex > 0) {
        int oldIndex = tranferIndex;
        int newIndex = oldIndex > stride ? oldIndex - stride : 0;
        if (!cas(transferIndex, oldIndex, newIndex)) {
            continue; // 失败继续, 自旋 CAS
        }
        // CAS 成功, 处理下标在 [newIndex, oldIndex) 之间的 table 数组中的链表
    }
}

前面讲到，ConcurrentHashMap 的扩容是写时复制操作，在将老的 table 数组中的所有链表全部赋值到新的 table 数组之后，才会将 table 引用更新为指向新的 table 数组
那么多个线程协作扩容，谁来执行最后将 table 引用更新为指向新的 table 数组这一操作呢？显然，谁最后完成就谁来做，怎么来标记谁最后完成呢？

ConcurrentHashMap 中的定义了一个int类型的共享变量 sizeCtl，用来标记当前正在参与扩容的线程个数，sizeCtl 初始值为 0
当某个线程参与扩容时，就通过 CAS 将 sizeCtl 更新为 sizeCtl + 1，当这个线程手上持有的链表都复制完成，并且 table 数组中没有剩余的链表可以分配时，这个线程就通过 CAS 将 sizeCtl 更新为 sizeCtl - 1
当某个线程执行完 sizeCtl - 1 操作之后，如果 sizeCtl 变为 0，那么就表示这个线程就是最后一个线程，负责将 table 引用更新为指向新的 table 数组

实际上 sizeCtl 也可以声明为 AtomicInteger 类型，这样就避免了自己实现 CAS 操作
不过尽管使用封装好的 AtomicInteger 更加方便，但性能却没有使用自己实现 CAS 操作高，这也是 ConcurrentHashMap 没有使用 AtomicInteger 的原因

对于以上并发扩容的处理逻辑，我们举例进一步解释，如下图所示

5、size() 函数的实现原理

size() 函数返回 ConcurrentHashMap 容器中的元素个数，实现 size() 函数的方法有很多种，如下所示

5.1、扫描统计

最简单的实现方法是扫描统计，每次调用 size() 函数时，我们把 table 数组中的所有链表都遍历一遍，统计得到总的元素个数
但是如果 size() 函数不加锁，那么在扫描统计的同时执行写操作，就会导致扫描统计的结果不准确
如果 size() 加锁，那么就会跟写操作、树化、扩容互斥，并发性能降低
除此之外，每次调用 size() 都扫描整个 table 数组，执行效率也非常低

5.2、实时统计

为了提高 size() 函数的执行效率，我们可以改用实时统计的方法来实现
在 ConcurrentHashMap 中维护一个 size 成员变量，每当执行增、删元素操作时，都同步更新 size

但是不管是将 size 设置为 AtomicInteger，还是通过 CAS 更新 size，又或者加锁更新
在高并发场景下，多个线程同时竞争更新 size，就会存在性能问题，进而影响增、删操作的性能

5.3、非一致性统计

为了解决实时统计存在的问题，我们可以借鉴 LongAdder 的实现思路，每个链表维护一个实时统计的 cellSize，表示这个链表的节点个数
当调用 size() 函数时，我们将每个链表的 cellSize 相加，便得到了 ConcurrentHashMap 容器中总的元素个数
当然这也会导致统计结果的不准确或者不一致，关于这点，你可以参看 LongAdder 的讲解

6、课后思考题

6.1、问题一

对于 JDK 7 中的 HashMap，两个线程并发执行扩容操作，有可能会导致后续的读操作死循环，请分析具体产生的原因

死循环产生于两个线程同时进行扩容操作，扩容的源码如下所示
在扩容的过程中，老的 table 数组中的节点会通过头插（即在链表头部插入元素）的方式插入到新的 table 数组中

 void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry e : table) {
        while (null != e) {
            Entry next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

当两个线程同时执行 transfer() 函数时，如果线程 t1 和线程 t2 的 e 和 next 均指向相同的节点，如下图所示
当线程 t1 和线程 t2 执行完一次 while 循环之后，新的 table 数组中变成生了环，此时执行 get() 操作便会进入死循环

因为 JDK 8 中 HashMap 的扩容是尾插而非头插，因此 JDK 8 中的 HashMap 不存在以上问题

6.2、问题二

请对比 JDK 8 中 ConcurrentHashMap 的实现原理，简单分析一下 JDK 7 中 ConcurrentHashMap 的实现原理

相较于 JDK 8 中的 ConcurrentHashMap，JDK 7 中的 ConcurrentHashMap 最大的不同在于分段加锁的粒度
JDK 8 中 ConcurrentHashMap 的每个链表独享一把锁，而 JDK 7 中 ConcurrentHashMap 的多个链表共享一把锁，显然 JDK 8 中 ConcurrentHashMap 的并发性能更好

上一篇代码随想录总结

下一篇设计模式总结

posted @ 2023-06-20 13:15 lidongdongdong~ 阅读(37) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

lidong