并发——详细介绍CAS机制

一、前言

  今天花了点时间了解了一下JDK1.8ConcurrentHashMap的实现,发现它实现的主要思想就是依赖于CAS机制。CAS机制是并发中比较重要的一个概念,所以今天这篇博客就来详细介绍一下CAS机制以及Java中对CAS的适用。


二、正文

 2.1 乐观锁与悲观锁

  在讲CAS之前,先来理解两个概念,即乐观锁和悲观锁:

  • 乐观锁:在并发下对数据进行修改时保持乐观的态度,认为在自己修改数据的过程中,其他线程不会对同一个数据进行修改,所以不对数据加锁,但是会在最终更新数据前,判断一下这个数据有没有被修改,若没有被修改,才将它更新为自己修改的值;
  • 悲观锁:在并发下对数据进行修改时保持悲观的态度,认为在自己修改数据的过程中,其他线程也会对数据进行修改,所以在操作前会对数据加锁,在操作完成后才将锁释放,而在释放锁之前,其他线程无法操作数据;

  CAS其实就是乐观锁的一种实现方式,而悲观锁比较典型的就是Java中的synchronized。下面我就来详细介绍一下CAS的相关概念。


 2.2 什么是CAS?

  CAS全称compare and swap——比较并替换,它是并发条件下修改数据的一种机制,包含三个操作数:

  • 需要修改的数据的内存地址(V);
  • 对这个数据的旧预期值(A);
  • 需要将它修改为的值(B);

  CAS的操作步骤如下:

  1. 修改前记录数据的内存地址V;
  2. 读取数据的当前的值,记录为A;
  3. 修改数据的值变为B;
  4. 查看地址V下的值是否仍然为A,若为A,则用B替换它;若地址V下的值不为A,表示在自己修改的过程中,其他的线程对数据进行了修改,则不更新变量的值,而是重新从步骤2开始执行,这被称为自旋

  通过以上四个步骤对内存中的数据进行修改,就可以保证数据修改的原子性。CAS是乐观锁的一种实现,所以这里介绍的步骤和乐观锁的定义差不多,还是很好理解的。


 2.3 Java中CAS的使用

  Java中大量使用的CAS,比如,在java.util.concurrent.atomic包下有很多的原子类,如AtomicIntegerAtomicBoolean......这些类提供对intboolean等类型的原子操作,而底层就是通过CAS机制实现的。比如AtomicInteger类有一个实例方法,叫做incrementAndGet,这个方法就是将AtomicInteger对象记录的值+1并返回,与i++类似。但是这是一个原子操作,不会像i++一样,存在线程不一致问题,因为i++不是原子操作。比如如下代码,最终一定能够保证num的值为200

// 声明一个AtomicInteger对象
AtomicInteger num = new AtomicInteger(0);
// 线程1
new Thread(()->{
    for (int i = 0; i < 100; i++) {
        // num++
        num.incrementAndGet();
    }
}).start();
// 线程2
new Thread(()->{
    for (int i = 0; i < 100; i++) {
        // num++
        num.incrementAndGet();
    }
}).start();

Thread.sleep(1000);
System.out.println(num);

  我们看看incrementAndGet方法的源码:

public final int incrementAndGet() {
    return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
}

  这里使用了一个unsafe对象,而unsafe对象是什么呢?我们知道,Java并不能像C或C++一样,直接操作内存,但是JVM为我们提供了一个后门,就是sun.misc.Unsafe类,这个类为我们实现了很多硬件级别的原子方法,当然,这些方法都是native方法,使用其他语言实现,而不是Java方法。而上面的另外一个变量valueOffset就是我们需要修改的变量在内存中的偏移量。也许上面这个方法并不能让你感觉使用了CAS,那再看看下面这个方法:

public final boolean compareAndSet(int expect, int update) {
    return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}

  compareAndSetAtomicInteger的另一个方法,它的作用就是给定一个预期的旧值expect,以及需要更新为的值update,若当前变量的值是expect,就将其修改为update,否则不修改(这不就是CAS的思想吗)。而它底层调用了unsafe对象的compareAndSwapInt方法,从这个名字可以看出,它的实现使用的就是CAScompareAndSwapInt的三个参数valueOffsetexpect以及update,刚好对应了CAS操作的三个操作数。


 2.4 CAS机制的ABA问题

  CAS机制虽然简单,但是也存在一些缺陷,其中比较典型的就是ABA问题。什么是ABA问题,我简单介绍一下:

  1. 假设有三个线程T1T2T3,它们都要对一个变量num的值进行修改,且使用的都是CAS机制进行同步,假设num的初始值为100
  2. 线程T1首先读取了num的值,将它记录为旧预期A1 = 100,然后它想要将num的值修改为80,记录B2 = 80,在执行num = B2前,线程发生了切换,切换到线程T2
  3. 假设T2毫无阻碍地修改了num的值,将它从100修改为80,然后线程再度切换,T3开始执行;
  4. T3也是毫无阻碍地修改了num,将它从80重新修改为100,线程再次切换回T1
  5. T1从上次运行的断点恢复,也就是准备用B1的值覆盖num,但是由于CAS机制,它需要先检测num的值是否等于它记录的预期值A1,然后它发现A1 = num = 100,认为num没有被修改过,于是用B1覆盖了num

  上面这种情况就是CASABA问题:一个变量被修改,但是又被改了回去,在CAS机制中,将无法察觉这种错误的现象。在线程T1被中断的过程中,num的值被修改,按照CAS的原则,T1应该放弃对num的修改,从头开始执行。有人可能想问,修改回去之后,不就和没修改一样吗,有什么影响呢?其实我也不知道有什么影响.....找遍网上的博客,举的例子都是在扯淡,误人子弟(看的最多的例子就是那个银行取钱的,一个人乱写,其他人乱copy,真心服了)。如果有知道ABA问题影响的朋友,麻烦告知一下。
  对于ABA问题的解决方案也非常简单,那就是再添加一个变量——版本号。每个变量都加上一个版本号,在它被修改时,也同步修改版本号,而CAS操作在修改前记录版本号,若在最后更新变量时,记录的版本号与当前版本号一致,表示没有被修改,可直接更新。


 2.5 CAS的优缺点以及适用场景

(1)优点

  前面也提到过,CAS是一种乐观锁,其优点就是不需要加锁就能进行原子操作;

(2)缺点

  CAS的缺点主有两点:

  • CAS机制只能用在对某一个变量进行原子操作,无法用来保证多个变量或语句的原子性(synchronized可以);
  • 假设在修改数据的过程中经常与其他线程修改冲突,将导致需要多次的重新尝试;

(3)适用场景

  由上面分析的优缺点可以看出,CAS适用于并发冲突发生频率较低的场合,而对于并发冲突较频繁的场合,CAS由于不断重试,反倒会降低效率。


三、总结

  CAS是一种在并发下实现原子操作的机制,但是只能用来保证一个变量的原子性,适用于并发冲突频率较低的场合。


四、参考

  推荐两篇描述CAS的博客,这两篇博客通过漫画对CAS进行了非常详细的描述:

posted @ 2020-03-27 23:11  特务依昂  阅读(3056)  评论(1编辑  收藏  举报