【*】CAS 是什么,Java8是如何优化 CAS 的

 


文章结构

前言

想要读懂 Java 中的并发包,就是要先读懂 CAS 机制,因为 CAS 是并发包的底层实现原理。本文主要讨论

  1.  CAS 是如何保证操作的原子性的
  2.  Java8 对 CAS 进行了哪些优化

synchronized:大材小用

我们先来看几行代码:

1
2
3
4
5
6
public class CASTest {
    static int i = 0;
    public static void increment() {
        i++;
    }
}

假如有100个线程同时调用 increment() 方法对 i 进行自增操作,i 的结果会是 100 吗?

学会多线程的同学应该都知道,这个方法是线程不安全的,由于 i++ 不是一个原子操作所以是很难得到 100 的

100个线程同时调用 increment()进行 i++ 操作,为什么得不到100?

i++操作计算机需要分成三步来执行:

  1. 读取 i 的值。
  2. 把 i 加 1。
  3. 把最终 i 的结果写入内存之中。所以,
  • 假如线程 A 读取了 i 的值为 i = 0,这个时候线程 B 也读取了 i 的值 i = 0。
  • 接着 A把 i 加 1,然后写入内存,此时 i = 1。紧接着,B也把 i 加 1,此时线程B中的 i = 1,然后线程 B 把 i 写入内存,此时内存中的 i = 1。
  • 也就是说,线程 A, B 都对 i 进行了自增,但最终的结果却是 1,不是 2。

解决思路一般都是给这个方法加个锁

1
2
3
4
5
6
public class CASTest {
    static int i = 0;
    public synchronized static void increment() {
        i++;
    }
}

加了 synchronized 之后,就最多只能有一个线程能够进入这个 increment() 方法了。这样,就不会出现线程不安全了。不懂 synchronized 的可以看我这篇文章:彻底搞懂synchronized(从偏向锁到重量级锁)

然而,一个简简单单的自增操作,就加了 synchronized 进行同步,好像有点大材小用的感觉,加了 synchronized 关键词之后,当有很多线程去竞争 increment 这个方法的时候,拿不到锁的方法是会被阻塞在方法外面的,最后再来唤醒他们,而阻塞/唤醒这些操作,是非常消耗时间的。

CAS :这种小事交给我

那有没有其他方法来代替 synchronized 对方法的加锁,并且保证 increment() 方法是线程安全呢?

大家看一下,如果我采用下面这种方式,能否保证 increment 是线程安全的呢?步骤如下:

CAS原理

  1. 线程从内存中读取 i 的值,假如此时 i 的值为 0,我们把这个值称为 k 吧,即此时 k = 0。
  2. 令 j = k + 1。
  3. 用 k 的值与内存中i的值相比,如果相等,这意味着没有其他线程修改过 i 的值,我们就把 j(此时为1) 的值写入内存;如果不相等(意味着i的值被其他线程修改过),我们就不把j的值写入内存,而是重新跳回步骤 1,继续这三个操作。

CAS原理翻译成代码示例

1
2
3
4
5
6
public static void increment() {
    do{
        int k = i;
        int j = k + 1;
    }while (compareAndSet(i, k, j))
}

如果你去模拟一下,就会发现,这样写是线程安全的。

这里可能有人会说,第三步的 compareAndSet 这个操作不仅要读取内存,还干了比较、写入内存等操作,这一步本身就是线程不安全的啊?

如果你能想到这个,说明你是真的有去思考、模拟这个过程,不过我想要告诉你的是,这个 compareAndSet 操作,他其实只对应操作系统的一条硬件操作指令,尽管看似有很多操作在里面,但操作系统能够保证他是原子执行的

对于一条英文单词很长的指令,我们都喜欢用它的简称来称呼他,所以,我们就把 compareAndSet 称为 CAS 吧。

所以,采用 CAS 这种机制的写法也是线程安全的,通过这种方式,可以说是不存在锁的竞争,也不存在阻塞等事情的发生,可以让程序执行的更好。

在 Java 中,也是提供了这种 CAS 的原子类

  1. AtomicBoolean
  2. AtomicInteger
  3. AtomicLong
  4. AtomicReference

具体如何使用呢?我就以上面那个例子进行改版吧,代码如下:

1
2
3
4
5
6
7
public class CASTest {
    static AtomicInteger i = new AtomicInteger(0);
    public static void increment() {
        // 自增 1并返回之后的结果
        i.incrementAndGet();
    }
}

CAS:谁偷偷更改了我的值

什么是ABA?

虽然这种 CAS 的机制能够保证increment() 方法,但依然有一些问题,例如,当线程A即将要执行第三步的时候,线程 B 把 i 的值加1,之后又马上把 i 的值减 1,然后,线程 A 执行第三步,这个时候线程 A 是认为并没有人修改过 i 的值,因为 i 的值并没有发生改变。而这,就是我们平常说的ABA问题

对于基本类型的值来说,这种把数字改变了在改回原来的值是没有太大影响的,但如果是对于引用类型的话,就会产生很大的影响了。

如何解决ABA?

为了解决这个 ABA 的问题,我们可以引入版本控制,例如,每次有线程修改了引用的值,就会进行版本的更新,虽然两个线程持有相同的引用,但他们的版本不同,这样,我们就可以预防 ABA 问题了。Java 中提供了 AtomicStampedReference 这个类,就可以进行版本控制了。

Java8 对 CAS 的优化

Java8之前CAS存在的问题

由于采用这种 CAS 机制是没有对方法进行加锁的,所以,所有的线程都可以进入 increment() 这个方法,假如进入这个方法的线程太多,就会出现一个问题每次有线程要执行第三个步骤的时候,i 的值老是被修改了,所以线程又到回到第一步继续重头再来

而这就会导致一个问题由于线程太密集了,太多人想要修改 i 的值了,进而大部分人都会修改不成功,白白着在那里循环消耗资源

Java8对CAS的优化方法

为了解决这个问题,Java8 引入了一个 cell[] 数组,它的工作机制是这样的:

  • 假如有 5 个线程要对 i 进行自增操作,由于 5 个线程的话,不是很多,起冲突的几率较小,那就让他们按照以往正常的那样,采用 CAS 来自增吧。
  • 如果有 100 个线程要对 i 进行自增操作的话,这个时候,冲突就会大大增加,系统就会把这些线程分配到不同的 cell 数组元素去。假如 cell[10] 有 10 个元素吧,且元素的初始化值为 0,那么系统就会把 100 个线程分成 10 组,每一组对 cell 数组其中的一个元素做自增操作,这样到最后,cell 数组 10 个元素的值都为 10,系统在把这 10 个元素的值进行汇总,进而得到 100,二这,就等价于 100 个线程对 i 进行了 100 次自增操作。
posted @   二叉树的博客  阅读(1053)  评论(0编辑  收藏  举报
努力加载评论中...
点击右上角即可分享
微信分享提示