CAS介绍及原理分析
我们知道多线程操作共享资源时,会出现三个问题:可见性、有序性以及原子性。
一般情况下,我们采用synchronized同步锁(独占锁、互斥锁),即同一时间只有一个线程能够修改共享变量,其他线程必须等待。但是这样的话就相当于单线程,体现不出来多线程的优势。
那么我们有没有另一种方式来解决这三个问题呢?
在前面,我们提到了一个volatile关键字,它可以解决可见性和有序性的问题。而且如果操作的共享变量是基本数据类型,并且同一时间只对变量进行读取或者写入的操作,那么原子性问题也得到了解决,就不会产生多线程问题了。
但是通常,我们都要先读取共享变量,然后操作共享变量,最后写入共享变量,那么这个时候怎么保证整个操作的原子性呢?一种解决方式就是CAS技术。
CAS(Compare and Swap)即比较并交换。在讲解这个之前,先了解两个重要概念:悲观锁与乐观锁。
悲观锁和乐观锁
悲观锁:假定会发生并发冲突,即共享资源会被某个线程更改。所以当某个线程获取共享资源时,会阻止别的线程获取共享资源。也称独占锁或者互斥锁,例如java中的synchronized同步锁。
乐观锁:假设不会发生并发冲突,只有在最后更新共享资源的时候会判断一下在此期间有没有别的线程修改了这个共享资源。如果发生冲突就重试,直到没有冲突,更新成功。CAS就是一种乐观锁实现方式。
悲观锁会阻塞其他线程。乐观锁不会阻塞其他线程,如果发生冲突,采用死循环的方式一直重试,直到更新成功。
CAS的实现原理
CAS的原理很简单,包含三个值当前内存值(V)、预期原来的值(A)以及期待更新的值(B)。
如果内存位置V的值与预期原值A相匹配,那么处理器会自动将该位置值更新为新值B,返回true。否则处理器不做任何操作,返回false。
实现CAS最重要的一点,就是比较和交换操作的一致性,否则就会产生歧义。
比如当前线程比较成功后,准备更新共享变量值的时候,这个共享变量值被其他线程更改了,那么CAS函数必须返回false。
要实现这个需求,java中提供了Unsafe类,它提供了三个函数,分别用来操作基本类型int和long,以及引用类型Object。
public final native boolean compareAndSwapObject
(Object obj, long valueOffset, Object expect, Object update);
public final native boolean compareAndSwapInt
(Object obj, long valueOffset, int expect, int update);
public final native boolean compareAndSwapLong
(Object obj, long valueOffset, long expect, long update);
参数的含义:
- obj 和 valueOffset:表示这个共享变量的内存地址。这个共享变量是obj对象的一个成员属性,valueOffset表示这个共享变量在obj类中的内存偏移量。所以通过这两个参数就可以直接在内存中修改和读取共享变量值。
- expect:表示预期原来的值。
- update:表示期待更新的值。
Java中的Atomic 原子操作包
JUC 并发包中原子类 , 都存放在 java.util.concurrent.atomic 类路径下:
根据操作的目标数据类型,可以将 JUC 包中的原子类分为 4 类:
- 基本原子类
- 数组原子类
- 原子引用类型
- 字段更新原子类
基本原子类
- AtomicInteger:整型原子类。
- AtomicLong:长整型原子类。
- AtomicBoolean :布尔型原子类。
数组原子类
- AtomicIntegerArray:整型数组原子类。
- AtomicLongArray:长整型数组原子类。
- AtomicReferenceArray :引用类型数组原子类。
引用原子类
引用原子类主要包括了以下三个:
- AtomicReference:引用类型原子类。
- AtomicMarkableReference :带有更新标记位的原子引用类型。
- AtomicStampedReference :带有更新版本号的原子引用类型。
AtomicStampedReference通过引入“版本”的概念,来解决ABA的问题。
字段更新原子类
字段更新原子类主要包括了以下三个:
- AtomicIntegerFieldUpdater:原子更新整型字段的更新器。
- AtomicLongFieldUpdater:原子更新长整型字段的更新器。
- AtomicReferenceFieldUpdater:原子更新引用类型里的字段。
接下来我们来看看java并发框架下的atomic包是如何使用CAS的。
原子类(atomic)
调用JUC并发框架下原子类的方法时,不需要考虑多线程问题。那么我们分析它是怎么解决多线程问题的。以AtomicInteger类为例。
成员变量
// 通过它来实现CAS操作的。因为是int类型,所以调用它的compareAndSwapInt方法
private static final Unsafe unsafe = Unsafe.getUnsafe();
// value这个共享变量在AtomicInteger对象上内存偏移量,
// 通过它直接在内存中修改value的值,compareAndSwapInt方法中需要这个参数
private static final long valueOffset;
// 通过静态代码块,在AtomicInteger类加载时就会调用
static {
try {
// 通过unsafe类,获取value变量在AtomicInteger对象上内存偏移量
valueOffset = unsafe.objectFieldOffset
(AtomicInteger.class.getDeclaredField("value"));
} catch (Exception ex) { throw new Error(ex); }
}
// 共享变量,AtomicInteger就保证了对它多线程操作的安全性。
// 使用volatile修饰,解决了可见性和有序性问题。
private volatile int value;
有三个重要的属性:
- unsafe:通过它实现CAS操作,因为共享变量是int类型,所以调用compareAndSwapInt方法。
- valueOffset:共享变量value在AtomicInteger对象上内存偏移量
- value:共享变量,使用volatile修饰,解决了可见性和有序性问题。
重要方法
get与set方法
// 直接读取。因为是volatile关键子修饰的,总是能看到(任意线程)对这个volatile变量最新的写入
public final int get() {
return value;
}
// 直接写入。因为是volatile关键子修饰的,所以它修改value变量也会立即被别的线程读取到。
public final void set(int newValue) {
value = newValue;
}
因为value变量是volatile关键字修饰的,它总是能读取(任意线程)对这个volatile变量最新的写入。它修改value变量也会立即被别的线程读取到。
compareAndSet方法
// 如果value变量的当前值(内存值)等于期望值(expect),那么就把update赋值给value变量,返回true。
// 如果value变量的当前值(内存值)不等于期望值(expect),就什么都不做,返回false。
// 这个就是CAS操作,使用unsafe.compareAndSwapInt方法,保证整个操作过程的原子性
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}
通过调用unsafe的compareAndSwapInt方法实现CAS函数的。但是CAS函数只能保证比较并交换操作的原子性,但是更新操作并不一定会执行。比如我们想让共享变量value自增。
共享变量value自增是三个操作:
- 读取value值
- 计算value+1的值
- 将value+1的值赋值给value。
分析这三个操作:
- 读取value值,因为value变量是volatile关键字修饰的,能够读取到任意线程对它最后一次修改的值,所以没问题。
- 计算value+1的值:这个时候就有问题了,可能在计算这个值的时候,其他线程更改了value值,因为没有加同步锁,所以其他线程可以更改value值。
- 将value+1的值赋值给value: 使用CAS函数,如果返回false,说明在当前线程读取value值到调用CAS函数方法前,共享变量被其他线程修改了,那么value+1的结果值就不是我们想要的了,因为要重新计算。
getAddAddInt方法
public final int getAndAddInt(Object obj, long valueOffset, int var) {
int expect;
// 利用循环,直到更新成功才跳出循环。
do {
// 获取value的最新值
expect = this.getIntVolatile(obj, valueOffset);
// expect + var表示需要更新的值,如果compareAndSwapInt返回false,说明value值被其他线程更改了。
// 那么就循环重试,再次获取value最新值expect,然后再计算需要更新的值expect + var。直到更新成功
} while(!this.compareAndSwapInt(obj, valueOffset, expect, expect + var));
// 返回当前线程在更改value成功后的,value变量原先值。并不是更改后的值
return expect;
}
这个方法在Unsafe类中,利用do_while循环,先利用当前值,计算更新值,然后通过compareAndSwapInt方法设置value变量,如果compareAndSwapInt方法返回失败,表示value变量的值被别的线程更改了,所以循环获取value变量最新值,再通过compareAndSwapInt方法设置value变量。直到设置成功。跳出循环,返回更新前的值。
// 将value的值当前值的基础上加1,并返回当前值
public final int getAndIncrement() {
return unsafe.getAndAddInt(this, valueOffset, 1);
}
// 将value的值当前值的基础上加-1,并返回当前值
public final int getAndDecrement() {
return unsafe.getAndAddInt(this, valueOffset, -1);
}
// 将value的值当前值的基础上加delta,并返回当前值
public final int getAndAdd(int delta) {
return unsafe.getAndAddInt(this, valueOffset, delta);
}
// 将value的值当前值的基础上加1,并返回更新后的值(即当前值加1)
public final int incrementAndGet() {
return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
}
// 将value的值当前值的基础上加-1,并返回更新后的值(即当前值加-1)
public final int decrementAndGet() {
return unsafe.getAndAddInt(this, valueOffset, -1) - 1;
}
// 将value的值当前值的基础上加delta,并返回更新后的值(即当前值加delta)
public final int addAndGet(int delta) {
return unsafe.getAndAddInt(this, valueOffset, delta) + delta;
}
都是利用unsafe.getAndAddInt方法实现的。
Unsafe类
Unsafe 是位于 sun.misc 包下的一个类,Unsafe 提供了CAS 方法,直接通过native 方式(封装 C++代码)调用了底层的 CPU 指令 cmpxchg。
Unsafe类,翻译为中文:危险的,Unsafe全限定名是 sun.misc.Unsafe,从名字中我们可以看出来这个类对普通程序员来说是“危险”的,一般应用开发者不会用到这个类。
Unsafe 提供的 CAS 方法
主要如下: 定义在 Unsafe 类中的三个 “比较并交换”原子方法
/*
@param o 包含要修改的字段的对象
@param offset 字段在对象内的偏移量
@param expected 期望值(旧的值)
@param update 更新值(新的值)
@return true 更新成功 | false 更新失败
*/
public final native boolean compareAndSwapObject(Object o, long offset, Object expected, Object update);
public final native boolean compareAndSwapInt( Object o, long offset, int expected,int update);
public final native boolean compareAndSwapLong( Object o, long offset, long expected, long update);
Unsafe 提供的 CAS 方法包含四个入参: 包含要修改的字段对象、字段内存位置、预期原值及新值。在执行 Unsafe 的 CAS 方法的时候,这些方法首先将内存位置的值与预期值(旧的值)比
较,如果相匹配,那么处理器会自动将该内存位置的值更新为新值,并返回 true ;如果不相匹配,处理器不做任何操作,并返回 false 。
获取属性偏移量
Unsafe 提供的获取字段(属性)偏移量的相关操作,主要如下:
/**
*@param o 需要操作属性的反射
*@return 属性的偏移量
*/
public native long staticFieldOffset(Field field);
public native long objectFieldOffset(Field field);
staticFieldOffset 方法用于获取静态属性 Field 在 Class 对象中的偏移量,在 CAS 操作静态属性时,会用到这个偏移量。
objectFieldOffset 方法用于获取非静态 Field (非静态属性)在 Object 实例中的偏移量,在 CAS 操作对象的非静态属性时,会用到这个偏移量。
根据属性的偏移量获取属性的最新值
/**
* @param o 字段所属于的对象实例
* @param fieldOffset 字段的偏移量
* @return 字段的最新值
*/
public native int getIntVolatile(Object o, long fieldOffset);
CAS的缺点
ABA问题
因为CAS需要在操作值的时候检查下值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。
JDK 提供了两个类 AtomicStampedReference、AtomicMarkableReference 来解决 ABA 问题。
只能保证一个共享变量的原子操作
一个比较简单的规避方法为:把多个共享变量合并成一个共享变量来操作。 JDK 提供了 AtomicReference 类来保证引用对象之间的原子性,可以把多个变量放在一个 AtomicReference 实例后再进行 CAS 操作。比如有两个共享变量 i=1、j=2,可以将二者合并成一个对象,然后用 CAS 来操作该合并对象的 AtomicReference 引用。
循环时间长开销大
高并发下N多线程同时去操作一个变量,会造成大量线程CAS失败,然后处于自旋状态,导致严重浪费CPU资源,降低了并发性。
解决 CAS 恶性空自旋的较为常见的方案为:
- 分散操作热点,使用 LongAdder 替代基础原子类 AtomicLong。
- 使用队列削峰,将发生 CAS 争用的线程加入一个队列中排队,降低 CAS 争用的激烈程度。JUC 中非常重要的基础类 AQS(抽象队列同步器)就是这么做的。
代码示例
AtomicInteger演示
import java.util.Collections;
import java.util.List;
import java.util.concurrent.CopyOnWriteArrayList;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.atomic.AtomicInteger;
class Data {
AtomicInteger num;
public Data(int num) {
this.num = new AtomicInteger(num);
}
public int getAndDecrement() {
return num.getAndDecrement();
}
}
class MyRun implements Runnable {
private Data data;
// 用来记录所有卖出票的编号
private List<Integer> list;
private CountDownLatch latch;
public MyRun(Data data, List<Integer> list, CountDownLatch latch) {
this.data = data;
this.list = list;
this.latch = latch;
}
@Override
public void run() {
try {
action();
} finally {
// 释放latch共享锁
latch.countDown();
}
}
// 进行买票操作,注意这里没有使用data.num>0作为判断条件,直到卖完线程退出。
// 那么做会导致这两处使用了共享变量data.num,那么做多线程同步时,就要考虑更多条件。
// 这里只for循环了5次,表示每个线程只卖5张票,并将所有卖出去编号存入list集合中。
public void action() {
for (int i = 0; i < 5; i++) {
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
int newNum = data.getAndDecrement();
System.out.println("线程"+Thread.currentThread().getName()+" num=="+newNum);
list.add(newNum);
}
}
}
public class ThreadTest {
public static void startThread(Data data, String name, List<Integer> list,CountDownLatch latch) {
Thread t = new Thread(new MyRun(data, list, latch), name);
t.start();
}
public static void main(String[] args) {
// 使用CountDownLatch来让主线程等待子线程都执行完毕时,才结束
CountDownLatch latch = new CountDownLatch(6);
long start = System.currentTimeMillis();
// 这里用并发list集合
List<Integer> list = new CopyOnWriteArrayList();
Data data = new Data(30);
startThread(data, "t1", list, latch);
startThread(data, "t2", list, latch);
startThread(data, "t3", list, latch);
startThread(data, "t4", list, latch);
startThread(data, "t5", list, latch);
startThread(data, "t6", list, latch);
try {
latch.await();
} catch (InterruptedException e) {
e.printStackTrace();
}
// 处理一下list集合,进行排序和翻转
Collections.sort(list);
Collections.reverse(list);
System.out.println(list);
long time = System.currentTimeMillis() - start;
// 输出一共花费的时间
System.out.println("\n主线程结束 time=="+time);
}
}
结果输出:
线程t1 num==30
线程t2 num==29
线程t3 num==28
线程t5 num==26
线程t4 num==27
线程t6 num==25
线程t1 num==24
线程t2 num==23
线程t6 num==22
线程t4 num==19
线程t5 num==20
线程t3 num==21
线程t2 num==18
线程t3 num==13
线程t5 num==14
线程t1 num==15
线程t6 num==17
线程t4 num==16
线程t2 num==12
线程t1 num==9
线程t5 num==10
线程t3 num==11
线程t4 num==7
线程t6 num==8
线程t5 num==5
线程t4 num==4
线程t1 num==6
线程t2 num==3
线程t3 num==2
线程t6 num==1
[30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
主线程结束 time==58
我们使用AtomicInteger,代替同步锁来解决多线程安全的。
AtomicStampedReference解决ABA
public static void main(String[] args) {
boolean success = false;
AtomicStampedReference<Integer> atomicStampedReference = new AtomicStampedReference<Integer>(1, 0);
int stamp = atomicStampedReference.getStamp();
success = atomicStampedReference.compareAndSet(1, 0, stamp, stamp + 1);
System.out.println("success:" + success + ";reference:" + "" + atomicStampedReference.getReference() + ";stamp:" + atomicStampedReference.getStamp());
//修改印戳,更新失败
stamp = 0; //上面第一次更新后stamp=1, 重新修改,会导致下面更新失败
success = atomicStampedReference.compareAndSet(0, 1, stamp, stamp + 1);
System.out.println("success:" + success + ";reference:" + "" + atomicStampedReference.getReference() + ";stamp:" + atomicStampedReference.getStamp());
}
AtomicReference
使用场景:并发修改多个属性
public static void main(String[] args) {
//创建两个Person对象,它们的id是101和102
Person p1 = new Person(101);
Person p2 = new Person(102);
//新建AtomicReference对象,初始化它的值为p1
AtomicReference ar = new AtomicReference(p1);
//p1 = new Person(101); //这里如果重新赋值,则下面的compareAndSet不会成功
//通过CAS设置ar,如果ar的值为p1,则设置为p2
ar.compareAndSet(p1, p2);
Person p3 = (Person) ar.get();
System.out.println("p3 is " + p3);
System.out.println("p3.equals(p1) is " + p3.equals(p1));
}
static class Person {
volatile long id;
public Person(long id) {
this.id = id;
}
public long getId() {
return id;
}
public void setId(long id) {
this.id = id;
}
@Override
public String toString() {
return "Person{" +
"id=" + id +
'}';
}
}