聊聊并发(六)——CAS算法

一、原子类

1、CAS算法

  强烈建议读者看这篇之前,先看这篇 初识JUC 的前两节,对原子性,原子变量,内存可见性有一个初步认识。

  CAS(Compare and Swap)是一种硬件对并发的支持,针对多处理器操作而设计的处理器中的一种特殊指令,用于管理对共享数据的并发访问,是硬件对于并发操作共享数据的支持。它是一个原子性的操作,对应到CPU指令为cmpxchg。它是一条CPU并发原语。
  CAS包含了3个操作数:内存值V,比较值A,更新值B。当且仅当V == A时,V = B,否则不执行任何操作。
  CAS算法:当多个线程并发的对主存中的数据进行修改的时候。有且只有一个线程会成功,其他的都会失败(同时操作,只是会失败而已,并不会被锁之类的)。
  CAS是一种无锁的非阻塞算法,是乐观锁的一种实现。不存在上下文切换的问题。
  CAS比普通同步锁效率高,原因:CAS算法当这一次不成功的时候,它下一次不会阻塞,也就是它不会放弃CPU的执行权,它可以立即再次尝试,再去更新。
  通俗的说:我要将变量 i 由 2 修改为 3。当内存中 i == 2,且修改成功,才为成功。若内存中 i 由于其他线程的操作已经不是 2 了,那此次我的修改视为失败。

2、简单使用

  JDK 1.5 以后java.util.concurrent.atomic包下提供了常用的原子变量。它支持单个变量上的无锁线程安全编程。这些原子变量具备以下特点:volatile的内存可见性;CAS算法保证数据的原子性。

  atomic包描述:图片来源API文档

  代码示例:原子变量使用

 1 public class Main {
 2     public static void main(String[] args) {
 3         AtomicInteger integer = new AtomicInteger(2);
 4 
 5         boolean b = integer.compareAndSet(3, 5);
 6         System.out.println(b);
 7         System.out.println(integer.get());
 8 
 9         b = integer.compareAndSet(2, 10);
10         System.out.println(b);
11         System.out.println(integer.get());
12 
13         // 等价于 i++
14         integer.getAndIncrement();
15 
16         // 等价于 ++i
17         integer.incrementAndGet();
18     }
19 }
20 
21 // 结果
22 false
23 2
24 true
25 10

  分析:很简单,设置初始值为 2。
  ①由 3 修改成5,而设置初始值内存值为2,所以修改失败,返回false。
  ②由 2 修改成10,初始值内存值为2,所以修改成功,返回true。

3、源码分析

  这些原子变量底层就是通过CAS算法来保证数据的原子性。
  源码示例:AtomicInteger 类

 1 public class AtomicInteger extends Number implements java.io.Serializable {
 2     private static final long serialVersionUID = 6214790243416807050L;
 3 
 4     // setup to use Unsafe.compareAndSwapInt for updates
 5     private static final Unsafe unsafe = Unsafe.getUnsafe();
 6     private static final long valueOffset;
 7 
 8     // 获取value在内存的地址偏移量
 9     static {
10         try {
11             valueOffset = unsafe.objectFieldOffset
12                 (AtomicInteger.class.getDeclaredField("value"));
13         } catch (Exception ex) { throw new Error(ex); }
14     }
15 
16     private volatile int value;
17 
18     public AtomicInteger(int initialValue) {
19         value = initialValue;
20     }
21 
22     public AtomicInteger() {
23     }
24 
25     public final int get() {
26         return value;
27     }
28 
29     public final void set(int newValue) {
30         value = newValue;
31     }
32 
33     public final boolean compareAndSet(int expect, int update) {
34         return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
35     }
36 
37     public final int getAndIncrement() {
38         return unsafe.getAndAddInt(this, valueOffset, 1);
39     }
40 
41     public final int incrementAndGet() {
42         return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
43     }
44 
45 }

  说明:public final boolean compareAndSet(int expect, int update)
  变量valueOffset:通过静态代码块获取变量value在内存中的偏移地址。
  变量value:用volatile修饰,这里体现了"多线程之间的内存可见性"。
  this:即 AtomicInteger 对象本身。
  很容易理解:就是将当前对象 this 的变量value,由期望值 expect 修改为 update。

  源码示例:Unsafe 类

 1 public final class Unsafe {
 2 
 3     public native void throwException(Throwable var1);
 4 
 5     public final native boolean compareAndSwapObject(Object var1, long var2, Object var4, Object var5);
 6 
 7     public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
 8 
 9     public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);
10 
11     public native int getIntVolatile(Object var1, long var2);
12 
13 
14     public final int getAndAddInt(Object var1, long var2, int var4) {
15         int var5;
16         do {
17             // 获取对象var1的变量var2的内存值
18             var5 = this.getIntVolatile(var1, var2);
19         } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
20 
21         return var5;
22     }
23 
24 }

  Unsafe是CAS的核心类,其所有方法都是native修饰的。也就是说Unsafe类中的方法都直接调用操作系统底层资源执行相应任务,是由C/C++编写的本地方法。CAS算法的实现,也是由Unsafe类通过调用本地方法直接操作特定内存数据来实现的。
  getAndIncrement()方法能够在多线程环境保证变量的原子性自增。但源码中,并没有加synchronized或者lock锁,那么,它是如何保证的呢?其实很简单:

  先获取一次变量的内存值,然后通过CAS算法进行比较更新。失败了就一直不停的重试,是一个循环的过程,这个过程也称作自旋。
  这就是为什么 AtomicInteger 的自增操作具备原子性。

1 private AtomicInteger i = new AtomicInteger();
2 public int getI() {
3     return i.getAndIncrement();
4 }

4、CAS的缺点

  (1)ABA问题。
  (2)循环时间变长:高并发情况下,使用CAS可能会存在一些线程一直循环修改不成功,导致循环时间变长,这会给CPU带来很大的执行开销。由于AtomicInteger中的变量是volatile的,为了保证内存可见性,需要保证缓存一致性,通过总线传输数据,当有大量的CAS循环时,会产生总线风暴。
  (3)只能保证一个变量的原子操作:如果需要保证多个变量操作的原子性,是做不到的。对于这种情况只能使用synchronized或者juc包中的Lock工具。

二、ABA问题

1、介绍

  代码示例:演示ABA问题

 1 // 原子引用类演示ABA问题
 2 public class ABATest {
 3     public static void main(String[] args) throws InterruptedException {
 4         AtomicReference<String> reference = new AtomicReference<>("A");
 5 
 6         // 线程 t1 由A修改B,又由B修改A
 7         new Thread(() -> {
 8             System.out.println(reference.compareAndSet("A", "B") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
 9             System.out.println(reference.compareAndSet("B", "A") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
10         }, "t1").start();
11 
12 
13         new Thread(() -> {
14             // 让t1线程完成ABA操作
15             try {
16                 Thread.sleep(500);
17             } catch (InterruptedException e) {
18                 e.printStackTrace();
19             }
20             System.out.println(reference.compareAndSet("A", "C") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
21 
22         }, "t2").start();
23 
24         Thread.sleep(1000);
25 
26         System.out.println(reference.get());
27     }
28 }
29 
30 // 结果
31 true. t1 value is:B
32 true. t1 value is:A
33 true. t2 value is:C
34 C

  如何理解ABA问题?
  可能你会觉得,线程 t2 不就是要将"A"改为"C"嘛,虽然中间变化了,但对 t2 也没影响呀!
  比如:你的银行卡里有10w,中间你领了工资1w,然后,又被扣除还了房贷1w,此时,你的银行卡里还是10w。虽然结果没变,但余额已经不是原来的余额了。而且,你一定在意中间你的钱去哪里了,所以是不一样的。
  再比如:对于公司财务来说,可能某一时刻,账户是100w,你偷偷挪用了公款20w,后来又悄悄补上了。虽然结果没变,但中间的记账明细,其实我们是关心的,因为这个时候你已经犯法了。

2、解决

  带时间戳的原子引用:Java提供了AtomicStampedReference来解决ABA问题。其实其实就是加了版本号,每一次的修改,版本号都 +1。比对的是 内存值 + 版本号 是否一致。
  代码示例:解决ABA问题

 1 public class ABATest {
 2     public static void main(String[] args) throws InterruptedException {
 3 
 4         AtomicStampedReference<String> reference = new AtomicStampedReference<>("A", 1);
 5         final int stamp = reference.getStamp();
 6 
 7         // 线程 t1 由A修改B,又由B修改A
 8         new Thread(() -> {
 9             System.out.println(reference.compareAndSet("A", "B", stamp, stamp + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
10             System.out.println(reference.compareAndSet("B", "A", reference.getStamp(), reference.getStamp() + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
11         }, "t1").start();
12         
13 
14         new Thread(() -> {
15             // 让t1线程完成ABA操作
16             try {
17                 Thread.sleep(500);
18             } catch (InterruptedException e) {
19                 e.printStackTrace();
20             }
21             System.out.println(reference.compareAndSet("A", "C", stamp, stamp + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
22 
23         }, "t2").start();
24 
25         Thread.sleep(1000);
26 
27         System.out.println(reference.getReference());
28     }
29 }
30 
31 // 结果
32 true. t1 value is:B
33 true. t1 value is:A
34 false. t2 value is:A    // t2并没有修改成功
35 A

  compareAndSet()方法的 4 个参数:

  expectedReference:表示期望的引用值
  newReference:表示要修改后的新引用值
  expectedStamp:表示期望的戳(版本号)
  newStamp:表示修改后新的戳(版本号)

3、源码分析

 1 public class AtomicStampedReference<V> {
 2 
 3     private static class Pair<T> {
 4         final T reference;
 5         final int stamp;
 6         private Pair(T reference, int stamp) {
 7             this.reference = reference;
 8             this.stamp = stamp;
 9         }
10         static <T> Pair<T> of(T reference, int stamp) {
11             return new Pair<T>(reference, stamp);
12         }
13     }
14     
15     public boolean compareAndSet(V   expectedReference,
16                                  V   newReference,
17                                  int expectedStamp,
18                                  int newStamp) {
19         Pair<V> current = pair;
20         return
21             expectedReference == current.reference &&
22             expectedStamp == current.stamp &&
23             ((newReference == current.reference &&
24               newStamp == current.stamp) ||
25              casPair(current, Pair.of(newReference, newStamp)));
26     }
27 
28     private boolean casPair(Pair<V> cmp, Pair<V> val) {
29         return UNSAFE.compareAndSwapObject(this, pairOffset, cmp, val);
30     }
31 }

  很简单,维护了一对Pair,里面除了引用reference,还有一个int类型的戳(版本号)。比较更新的时候,两个变量都要比较。

三、LongAdder

1、介绍

  《阿里巴巴Java开发手册》推荐使用LongAdder。

  AtomicLong,本质上是多个线程同时操作同一个目标资源,有且只有一个线程执行成功,其他线程都会失败,不断重试(自旋),自旋会成为瓶颈。
  而LongAdder的思想就是把要操作的目标资源[分散]到数组Cell中,每个线程对自己的Cell变量的value进行原子操作,大大降低了失败的次数。
  这就是为什么在高并发场景下,推荐使用LongAdder的原因。

 

  参考文档:https://www.matools.com/api/java8

  《阿里巴巴Java开发手册》百度网盘:https://pan.baidu.com/s/1aWT3v7Efq6wU3GgHOqm-CA 密码: uxm8

posted @ 2021-12-02 09:44  Craftsman-L  阅读(1930)  评论(0编辑  收藏  举报