CAS原子性操作

CAS原理解析

1、CAS基本概念

CAS(Compare And Swap)也叫做比较与交换,是一种无锁原子算法,映射到操作系统就是一条cmpxchg硬件汇编指令,通过硬件命令保证了原子性。其作用是让CPU将内存值更新为新值,但是有个条件,内存值必须与期望值相同。CAS操作无需用户态和内核态切换,直接在用户态对内存进行读写操作,这意味着不会进行上下文切换。

它包含3个参数CAS(V,E,N),V表示待更新的内存值,E表示预期值,N表示新值,当V值等于E值时,才会将V值更新成N值,如果V值和E值不等,操作失败或者重新再来,这就是一次CAS的操作。

简单说,CAS需要你额外给出一个期望值,也就是你认为这个变量现在应该是什么样子的,如果变量不是你想象的那样,说明它已经被别人修改过了,你只需要重新读取,设置期望值,再次尝试修改就好了。

设置一个期望值的目的:通过内存值与期望值的比较,防止自己的修改覆盖了别人的修改

2、CAS如何保证原子性

原子性是指一个或多个操作在CPU执行过程中不被中断的特性,要么执行,要么不执行,不能执行到一半,即原子性操作是不可被中断的一个或一系列操作

为了保证CAS的原子性,CPU提供了下面两种方式

  • 总线锁定
  • 缓存锁定

2.1、总线锁定

总线(BUS)是计算机组件间数据传输方式,也就是说通过总线,CPU与其他组件连接传输数据,就是靠总线完成的,比如CPU对内存的读写。

总线锁定是指CPU使用了总线锁,所谓总线锁就是使用CPU提供的LOCK#信号,当CPU在总线上输出LOCK#信号时,其他CPU的总线请求将被阻塞。

2.2、缓存锁定

总线锁定方式虽然保持了原子性,但是在锁定期间,总线锁定阻止了被阻塞处理器和所有内存之间的通信,而输出LOCK#信号的CPU可能只需要锁住特定的一块内存区域,因此总线锁定开销较大。

所以现代CPU为了提升性能,通过锁定范围缩小的思想设计出缓存行锁定(缓存行是CPU高速缓存存储的最小单位)

所谓缓存锁定是指CPU对缓存行进行锁定,当缓存行中的共享变量回写到内存时,其他CPU会通过总线嗅探机制感知到该共享变量是否发生变化,如果发生变化,让自己对应的共享变量缓存行失效,重新从内存读取最新的数据,缓存锁定是基于缓存一致性机制来实现的,因为缓存一致性机制会阻止两个以上CPU同时修改同一个共享变量(现代CPU基本都支持和使用缓存锁定机制

缓存锁定是某个CPU对缓存数据进行更改时,会通知缓存了该数据的CPU抛弃缓存的数据或者从内存重新读取

2.3、缓存一致性

当程序在运行过程中,会将运算需要的数据从主存复制一份到CPU高速缓存中,那么CPU进行计算时就可以从它的高速缓存读取数据和向其中写入数据,当运算结束后,再将高速缓存中的数据刷新到主存中。

在多核CPU中,每个线程可能运行在不同的CPU中,因此每个线程运行时有自己的高速缓存。假如初始时 i 的值为0,那么我们希望两个线程执行完加1操作之后 i 的值变为2。但事实会是这样吗?

可能存在下面一种情况:初始时,两个线程分别读取i的值存入各自所在的CPU的高速缓存当中,然后线程1进行加1操作,然后把i的最新值1写入到内存。此时线程2的高速缓存当中i的值还是0,进行加1操作后,i的值为1,然后线程2把i的值写入内存。最终结果i的值是1,而不是2。这就是著名的缓存一致性问题。通常称这种被多个线程访问的变量为共享变量。

也就是说,如果一个变量在多个CPU中都存在缓存(一般在多线程编程时才会出现),那么就可能存在缓存不一致的问题。

为了解决缓存不一致问题,通常来说有以下2种解决方法:
1)通过在总线加LOCK锁的方式;
2)通过缓存一致性协议

在早期的CPU中,是通过在总线上加LOCK锁的形式来解决缓存不一致的问题。因为CPU和其他部件进行通信都是通过总线来进行的,如果对总线加LOCK锁的话,也就是说阻塞了其他CPU通过总线对其它部件访问(如内存),从而使得只能有一个CPU能使用这个变量的内存。比如上面例子中,如果一个线程在执行i = i +1,如果在执行这段代码的过程中,在总线上发出了LOCK锁的信号,那么只有等待这段代码完全执行完毕之后,其他CPU才能从变量 i 所在的内存读取变量,然后进行相应的操作。这样就解决了缓存不一致的问题。

但是上面的方式会有一个问题,由于在锁住总线期间,其他CPU无法访问内存,导致效率低下。

所以就出现了缓存一致性协议。该协议保证了每个缓存中使用的共享变量的副本是一致的。它的核心思想是:当CPU向内存写入数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存是无效的,那么它就会从内存重新读取。

3、CAS的问题

CAS和锁都解决了并发中的同步问题,和锁相比CAS没有阻塞、线程上下文切换、死锁。所以CAS要比锁拥有更优越的性能,但是CAS同样存在缺点。

CAS的问题如下:
1、只能保证一个共享变量的原子操作
2、在并发量大的情况下,CAS将消耗大量的CPU资源
3、ABA问题

3.1、只能保证一个共享变量的原子操作

CAS只能针对一个共享变量使用,如果是多个共享变量最好使用锁了,当然也是可以将多个变量整合一个变量。

3.2、在竞争激烈的情况下,CAS将消耗大量的CPU资源

在并发量大的情况下,很容发生多个线程反复尝试更新某一个变量,却又一直更新不成功,会消耗大量的CPU资源

3.3、ABA问题

CAS需要检查待更新的内存值与预期值是否相等,其本质是要检查待更新的内存值有没有被修改过,如果没有则更新,但是如果一个值原来是A,后来被修改成了B,再被更新为A,在CAS检查时,识别不出来数据被修改过。

如果只是简单的数据结构,确实不会有什么问题,如果是复杂的数据结构可能就会产生问题。以链表数据结构为例,两个线程通过CAS去删除头节点,假设现在链表上有A->B节点

1、线程1欲删除A节点,B节点成为头节点,正要执行CAS(A,A,B)时,时间片用完,切换到线程2
2、线程2删除A、B节点
3、线程2加入C、A节点
4、线程1重现获取时间片,执行CAS(A,A,B)
5、丢失C节点

要解决ABA问题也非常简单,只要追加版本号(version)即可,每次改变时version+1,即A —> B —> A,变成1A —> 2B —> 3A,在Java中提供了AtomicStampedRdference可以实现这个方案(面试只要问了C A S,就一定会问ABA,这块一定要搞明白

posted @ 2022-03-27 17:30  紫薇哥哥  阅读(934)  评论(0编辑  收藏  举报