ReentrantLock 源码分析以及 AQS (一)
前言
JDK1.5 之后发布了JUC(java.util.concurrent),用于解决多线程并发问题。AQS 是一个特别重要的同步框架,很多同步类都借助于 AQS 实现了对线程同步状态的管理。
AQS 中最主要的就是独占锁和共享锁的获取和释放,以及提供了一些可中断的获取锁,超时等待锁等方法。
ReentranLock 是基于 AQS 独占锁的一个实现。ReentrantReadWriteLock 是基于 AQS 共享锁的一个读写锁实现。本来打算一篇文章里面写完独占锁和共享锁,但是发现篇幅太长了,也不易于消化。
因此,本篇就先结合 ReentrantLock 源码,分析 AQS 的独占锁获取和释放。以及 ReentrantLock 的公平锁和非公平锁实现。
下一篇再写 ReentrantReadWriteLock 读写锁源码,以及 AQS 共享锁的获取和释放。
在正式讲解源码之前,墙裂建议读者做一些准备工作,最好对以下知识有一定的了解,这样阅读起来源码会比较轻松(因为,我当初刚开始接触多线程时,直接看 AQS 简直是一脸懵逼,就像读天书一样。。)。
- 了解双向链表的数据结构,以及队列的入队出队等操作。
- LockSupport 的 park,unpark 方法,以及对线程的 interrupt 几个方法了解(可参考:LockSupport的 park 方法是怎么响应中断的?)。
- 对 CAS 和自旋机制有一定的了解。
AQS 同步队列
AQS 内部维护了一个 FIFO(先进先出)的双向队列。它的内部是用双向链表来实现的,每个数据节点(Node)中都包含了当前节点的线程信息,还有它的前后两个指针,分别指向前驱节点和后继节点。下边看一下 Node 的属性和方法:
static final class Node {
//可以认为是一种标记,表明了这个 node 是以共享模式在同步队列中等待
static final Node SHARED = new Node();
//也是一种标记,表明这个 node 是以独占模式在同步队列中等待
static final Node EXCLUSIVE = null;
/** waitStatus 常量值 */
//说明当前节点被取消,原因有可能是超时,或者被中断。
//节点被取消的状态是不可逆的,也就是说此节点会一直停留在取消状态,不会转变。
static final int CANCELLED = 1;
//说明后继节点的线程被 park 阻塞,因此当前线程需要在释放锁或者被取消时,唤醒后继节点
static final int SIGNAL = -1;
//说明线程在 condition 条件队列等待
static final int CONDITION = -2;
//在共享模式中用,表明下一个共享线程应该无条件传播
static final int PROPAGATE = -3;
//当前线程的等待状态,除了以上四种值,还有一个值 0 为初始化状态(条件队列的节点除外)。
//注意这个值修改时是通过 CAS ,以保证线程安全。
volatile int waitStatus;
//前驱节点
volatile Node prev;
//后继节点
volatile Node next;
//当前节点中的线程,通过构造函数初始化,出队时会置空(这个后续说,重点强调)
volatile Thread thread;
//有两种情况。1.在 condition 条件队列中的后一个节点
//2. 一个特殊值 SHARED 用于表明当前是共享模式(因为条件队列只存在于独占模式)
Node nextWaiter;
//是否是共享模式,理由同上
final boolean isShared() {
return nextWaiter == SHARED;
}
//返回前驱节点,如果为空抛出空指针
final Node predecessor() throws NullPointerException {
Node p = prev;
if (p == null)
throw new NullPointerException();
else
return p;
}
Node() { // Used to establish initial head or SHARED marker
}
Node(Thread thread, Node mode) { // Used by addWaiter
this.nextWaiter = mode;
this.thread = thread;
}
Node(Thread thread, int waitStatus) { // Used by Condition
this.waitStatus = waitStatus;
this.thread = thread;
}
}
另外,在 AQS 类中,还会记录同步队列的头结点和尾结点:
//同步队列的头结点,是懒加载的,即不会立即创建一个同步队列,
//只有当某个线程获取不到锁,需要排队的时候,才会初始化头结点
private transient volatile Node head;
//同步队列的尾结点,同样是懒加载。
private transient volatile Node tail;
独占锁
这部分就结合 ReentrantLock 源码分析 AQS 的独占锁是怎样获得和释放锁的。
非公平锁
首先,我们从 ReentrantLock 开始分析,它有两个构造方法,一个构造,可以传入一个 boolean 类型的参数,表明是用公平锁还是非公平锁模式。另一个构造方法,不传入任何参数,则默认用非公平锁。
public ReentrantLock() {
sync = new NonfairSync();
}
public ReentrantLock(boolean fair) {
sync = fair ? new FairSync() : new NonfairSync();
}
NonfairSync 和 FairSync 都继承自 Sync ,它们都是 ReentranLock 的内部类。 而Sync 类又继承自 AQS (AbstractQueuedSynchronizer)。
static final class NonfairSync extends Sync {
}
static final class FairSync extends Sync {
}
abstract static class Sync extends AbstractQueuedSynchronizer {
}
知道了它们之间的继承关系,我们就从非公平锁的加锁方法作为入口,跟踪源码。因为非公平锁的流程讲明白之后,公平锁大致流程都一样,只是多了一个条件判断(这个,一会儿后边细讲,会做对比)。
NonfairSync.lock
我们看下公平锁的获取锁的方法:
final void lock() {
//通过 CAS 操作把 state 设置为 1
if (compareAndSetState(0, 1))
//如果设值成功,说明加锁成功,保存当前获得锁的线程
setExclusiveOwnerThread(Thread.currentThread());
else
//如果加锁失败,则执行 AQS 的acquire 方法
acquire(1);
}
public final void acquire(int arg) {
if (!tryAcquire(arg) &&
acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
selfInterrupt();
}
acquire
这个方法的逻辑是:
- 通过 tryAcquire 方法,尝试获取锁,如果成功,则返回 true,失败返回 false 。
- tryAcquire 失败之后,会先调用 addWaiter 方法,把当前线程封装成 node 节点,加入同步队列(独占模式)。
- acquireQueued 方法会把刚加入队列的 node 作为参数,通过自旋去获得锁。
tryAcquire
这是一个模板方法,具体的实现需要看它的子类,这里对应的就是 ReentrantLock.NonfairSync.tryAcquire 方法。我们看一下:
protected final boolean tryAcquire(int acquires) {
return nonfairTryAcquire(acquires);
}
final boolean nonfairTryAcquire(int acquires) {
//当前线程
final Thread current = Thread.currentThread();
//获取当前的同步状态,若为 0 ,表示无锁状态。若大于 0,表示已经有线程抢到了锁。
int c = getState();
if (c == 0) {
//然后通过 CAS 操作把 state 的值改为 1。
if (compareAndSetState(0, acquires)) {
// CAS 成功之后,保存当前获得锁的线程
setExclusiveOwnerThread(current);
return true;
}
}
// 如果 state 大于0,则判断当前线程是否是获得锁的线程,是的话,可重入。
else if (current == getExclusiveOwnerThread()) {
//由于 ReentrantLock 是可重入的,所以每重入一次 state 就加 1 。
int nextc = c + acquires;
if (nextc < 0)
throw new Error("Maximum lock count exceeded");
setState(nextc);
return true;
}
return false;
}
addWaiter
如果获取锁失败之后,就会调用 addWaiter 方法,把当前线程加入同步队列。
private Node addWaiter(Node mode) {
//把当前线程封装成 Node ,并且是独占模式
Node node = new Node(Thread.currentThread(), mode);
//尝试快速入队,如果失败,则会调用 enq 入队方法。enq 会初始化队列。
Node pred = tail;
//如果 tail 不为空,说明当前队列中已经有节点
if (pred != null) {
//把当前 node 的 prev 指针指向 tail
node.prev = pred;
//通过 CAS 把 node 设置为 tail,即添加到队尾
if (compareAndSetTail(pred, node)) {
//把旧的 tail 节点的 next 指针指向当前 node
pred.next = node;
return node;
}
}
//当 tail 为空时,把 node 添加到队列,如果需要的话,先进行队列初始化
enq(node);
//入队成功之后,返回当前 node
return node;
}
enq
通过自旋,把当前节点加入到队列中
private Node enq(final Node node) {
for (;;) {
Node t = tail;
//如果 tail为空,说明队列未初始化
if (t == null) {
//创建一个空节点,通过 CAS把它设置为头结点
if (compareAndSetHead(new Node()))
//此时只有一个 head头节点,因此把 tail也指向它
tail = head;
} else {
//第二次自旋时,tail不为空,于是把当前节点的 prev指向 tail节点
node.prev = t;
//通过 CAS把 tail节点设置为当前 node节点
if (compareAndSetTail(t, node)) {
//把旧的 tail节点的 next指向当前 node
t.next = node;
return t;
}
}
}
}
acquireQueued
入队成功之后,就会调用 acquireQueued 方法自旋抢锁。
final boolean acquireQueued(final Node node, int arg) {
boolean failed = true;
try {
boolean interrupted = false;
for (;;) {
//获取当前节点的前驱节点
final Node p = node.predecessor();
//如果前驱节点就是 head 节点,就调用 tryAcquire 方法抢锁
if (p == head && tryAcquire(arg)) {
//如果抢锁成功,就把当前 node 设置为头结点
setHead(node);
p.next = null; // help GC
failed = false;
//抢锁成功后,会把线程中断标志返回出去,终止for循环
return interrupted;
}
//如果抢锁失败,就根据前驱节点的 waitStatus 状态判断是否需要把当前线程挂起
if (shouldParkAfterFailedAcquire(p, node) &&
//线程被挂起时,判断是否被中断过
parkAndCheckInterrupt())
//注意此处,如果被线程被中断过,需要把中断标志重新设置一下
interrupted = true;
}
} finally {
if (failed)
//如果抛出异常,则取消锁的获取,进行出队操作
cancelAcquire(node);
}
}
setHead
通过代码,我们可以看到,当前的同步队列中,只有第二个节点才有资格抢锁。如果抢锁成功,则会把它设置为头结点。
private void setHead(Node node) {
head = node;
node.thread = null;
node.prev = null;
}
需要注意的是,这个方法,会把头结点的线程设置为 null 。想一下,为什么?
因为,此时头结点的线程已经抢锁成功,需要出队了。自然的,队列中也就不应该存在这个线程了。
PS:由 enq 方法,还有 setHead 方法,我们可以发现,头结点的线程总是为 null。这是因为,头结点要么是刚初始化的空节点,要么是抢到锁的线程出队了。因此,我们也常常把头结点叫做虚拟节点(不存储任何线程)。
shouldParkAfterFailedAcquire
以上是抢锁成功的情况,那么抢锁失败了呢?这时,我们需要判断是否应该把当前线程挂起。
private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
//获取当前节点的前驱节点的 waitStatus
int ws = pred.waitStatus;
if (ws == Node.SIGNAL)
//如果 ws = -1 ,说明当前线程可以被前驱节点正常唤醒,于是就可以安全的 park了
return true;
if (ws > 0) {
//如果 ws > 0,说明前驱节点被取消,则会从当前节点依次向前查找,
//直到找到第一个没有被取消的节点,把那个节点的 next 指向当前 node
//这一步,是为了找到一个可以把当前线程唤起的前驱节点
do {
node.prev = pred = pred.prev;
} while (pred.waitStatus > 0);
pred.next = node;
} else {
//如果 ws 为 0,或者 -3(共享锁状态),则把它设置为 -1
//返回 false,下次自旋时,就会判断等于 -1,返回 true了
compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
}
return false;
}
parkAndCheckInterrupt
如果 shouldParkAfterFailedAcquire 返回 true,说明当前线程需要被挂起。因此,就执行此方法,同时检查线程是否被中断。
private final boolean parkAndCheckInterrupt() {
//把当前线程挂起,则 acquireQueued 方法的自旋就会暂停,等待前驱节点 unpark
LockSupport.park(this);
//返回当前节点是否被中断的标志,注意此方法会把线程的中断标志清除。
//因此,返回上一层方法时,需要设置 interrupted = true 把中断标志重新设置,以便上层代码可以处理中断
return Thread.interrupted();
}
想一下,为什么抢锁失败后,需要判断是否把线程挂起?
因为,如果抢不到锁,并且还不把线程挂起,acquireQueued 方法就会一直自旋下去,这样你的CPU能受得了吗。
cancelAcquire
当不停的自旋抢锁时,若发生了异常,就会调用此方法,取消正在尝试获取锁的线程。node 的位置分为三种情况,见下面注释,
private void cancelAcquire(Node node) {
if (node == null)
return;
// node 不再指向任何线程
node.thread = null;
Node pred = node.prev;
//从当前节点不断的向前查找,直到找到一个有效的前驱节点
while (pred.waitStatus > 0)
node.prev = pred = pred.prev;
Node predNext = pred.next;
//把 node 的 ws 设置为 -1
node.waitStatus = Node.CANCELLED;
// 1.如果 node 是 tail,则把 tail 更新为 node,并把 pred.next 指向 null
if (node == tail && compareAndSetTail(node, pred)) {
compareAndSetNext(pred, predNext, null);
} else {
int ws;
//2.如果 node 既不是 tail,也不是 head 的后继节点,就把 node的前驱节点的 ws 设置为 -1
//最后把 node 的前驱节点的 next 指向 node 的后继节点
if (pred != head &&
((ws = pred.waitStatus) == Node.SIGNAL ||
(ws <= 0 && compareAndSetWaitStatus(pred, ws, Node.SIGNAL))) &&
pred.thread != null) {
Node next = node.next;
if (next != null && next.waitStatus <= 0)
compareAndSetNext(pred, predNext, next);
} else {
//3.如果 node是 head 的后继节点,则直接唤醒 node 的后继节点。
//这个也很好理解,因为 node 是队列中唯一有资格尝试获取锁的节点,
//它放弃了资格,当然有义务把后继节点唤醒,以让后继节点尝试抢锁。
unparkSuccessor(node);
}
node.next = node; // help GC
}
}
unparkSuccessor
这个唤醒方法就比较简单了,
private void unparkSuccessor(Node node) {
int ws = node.waitStatus;
if (ws < 0)
compareAndSetWaitStatus(node, ws, 0);
Node s = node.next;
if (s == null || s.waitStatus > 0) {
s = null;
//从尾结点向前依次遍历,直到找到距离当前 node 最近的一个有效节点
for (Node t = tail; t != null && t != node; t = t.prev)
if (t.waitStatus <= 0)
s = t;
}
if (s != null)
//把这个有效节点的线程唤醒,
//唤醒之后,当前线程就可以继续自旋抢锁了,(回到 park 的地方)
LockSupport.unpark(s.thread);
}
下面画一个流程图更直观的查看整个获取锁的过程。
公平锁
公平锁和非公平锁的整体流程大致相同,只是在抢锁之前先判断一下是否已经有人排在前面,如果有的话,就不执行抢锁。我们通过源码追踪到 FairSync.tryAcquire 方法。会发现,多了一个 hasQueuedPredecessors 方法。
hasQueuedPredecessors
这个方法判断逻辑稍微有点复杂,有多种情况。
public final boolean hasQueuedPredecessors() {
Node t = tail;
Node h = head;
Node s;
return h != t &&
((s = h.next) == null || s.thread != Thread.currentThread());
}
- 如果 h == t,说明 h 和 t 都为空(此时队列还未初始化)或者它们是同一个节点(说明队列已经初始化,并且只有一个节点,此时为 enq 方法第一次自旋成功后)。此时,返回false。
- 如果 h != t,则判断 head.next == null 是否成立,如果成立,则返回 true。这种情况发生在有其他线程第一次入队时。在 AQS 的 enq 入队方法,设置头结点成功之后 compareAndSetHead(new Node()) ,还未执行 tail = head 时(仔细想一想为什么?)。此时 tail = null , head = new Node(),head.next = null。
- 如果 h != t,并且 head.next != null,说明此时队列中至少已经有两个节点,则判断 head.next 是否是当前线程。如果是,返回 false(注意是 false哦,因为用了 !),否则返回 true 。
总结:以上几种情况,只有最终返回 false 时,才会继续往下执行。因为 false,说明没有线程排在当前线程前面,于是通过 CAS 尝试把 state 值设置为 1。若成功,则方法返回。若失败,同样需要去排队。
公平锁和非公平锁区别
举个例子来对比公平锁和非公平锁。比如,现在到饭点了,大家都到食堂打饭。把队列中的节点比作排队打饭的人,每个打饭窗口都有一个管理员,只有排队的人从管理员手中抢到锁,才有资格打饭。打饭的过程就是线程执行的过程。
如果,你发现前面没有人在排队,那么就可以直接从管理员手中拿到锁,然后打饭。对于公平锁来说,如果你前面有人在打饭,那么你就要排队到他后面(图中B),等他打完之后,把锁还给管理员。那么,你就可以从管理员手中拿到锁,然后打饭了。后面的人依次排队。这就是FIFO先进先出的队列模型。
对于非公平锁来说,如果你是图中的 B,当 A 把锁还给管理员后,有可能有另外一个 D 插队过来直接把锁抢走。那么,他就可以打饭,你只能继续等待了。
所以,可以看出来。公平锁是严格按照排队的顺序来的,先来后到嘛,你来的早,就可以早点获取锁。优点是,这样不会造成某个线程等待时间过长,因为大家都是中规中矩的在排队。而缺点呢,就是会频繁的唤起线程,增加 CPU的开销。
非公平锁的优点是吞吐量大,因为有可能正好锁可用,然后线程来了,直接抢到锁了,不用排队了,这样也减少了 CPU 唤醒排队线程的开销。 但是,缺点也很明显,你说我排队排了好长时间了,终于轮到我打饭了,凭什么其他人刚过来就插到我前面,比我还先打到饭,也太不公平了吧,后边一大堆排队的人更是怨声载道。这要是每个人来了都插到我前面去,我岂不是要饿死了。
独占锁的释放
我们从 ReentrantLock 的 unlock 方法看起:
public void unlock() {
//调用 AQS 的 release 方法
sync.release(1);
}
public final boolean release(int arg) {
if (tryRelease(arg)) {
Node h = head;
//如果头结点不为空,并且 ws 不为 0,则唤起后继节点
if (h != null && h.waitStatus != 0)
unparkSuccessor(h);
return true;
}
return false;
}
这段逻辑比较简单,当线程释放锁之后,就会唤醒后继节点。 unparkSuccessor 已讲,不再赘述。然后看下 tryRelease 方法,公平锁和非公平锁走的是同一个方法。
protected final boolean tryRelease(int releases) {
//每释放一次锁,state 值就会减 1,因为之前可能有锁的重入
int c = getState() - releases;
//如果当前线程不是抢到锁的线程,则抛出异常
if (Thread.currentThread() != getExclusiveOwnerThread())
throw new IllegalMonitorStateException();
boolean free = false;
if (c == 0) {
//只有 state 的值减到 0 的时候,才会全部释放锁
free = true;
setExclusiveOwnerThread(null);
}
setState(c);
return free;
}
因为,ReentrantLock 支持锁的重入,所以每次重入 state 值都会加 1,相应的每次释放锁, state 的值也会减 1 。所以,这也是为什么每个 lock 方法最后都要有一个 unlock 方法释放锁,它们的个数需要保证相同。
当 state 值为 0 的时候,说明锁完全释放。其他线程才可以有机会抢到锁。
结语
以上已经讲解了独占锁主要的获取方法 acquire ,另外还有一些其他相关方法,不再赘述,因为主要逻辑都是一样的,只有部分稍有不同,只要理解了 acquire ,这些都是相通的。如 acquireInterruptibly 方法,它可以在获取锁的时候响应中断。还有超时获取锁的方法 doAcquireNanos 可以设定获取锁的超时时间,超时之后就返回失败。
下篇预告:分析 ReentrantReadWriteLock 读写锁源码,以及 AQS 共享锁的获取和释放,敬请期待。
如果本文对你有用,欢迎点赞,评论,转发。
学习是枯燥的,也是有趣的。我是「烟雨星空」,欢迎关注,可第一时间接收文章推送。