Java并发之Semaphore源码解析(二)
在上一章,我们学习了信号量(Semaphore)是如何请求许可证的,下面我们来看看要如何归还许可证。
可以看到当我们要归还许可证时,不论是调用release()或是release(int permits),都会调用AQS实现的releaseShared(int arg)方法。在releaseShared(int arg)方法中会先调用子类实现的tryReleaseShared(int arg)方法,这个方法会向信号量归还许可证,在归还完毕后,会调用doReleaseShared()方法尝试唤醒信号量等待队列中需要许可证的线程,这也印证了笔者之前所说的线程在归还信号量后,会尝试唤醒等待队列中等待许可证的线程。
那我们来看看信号量(Semaphore)静态内部类Sync实现的tryReleaseShared(int releases)是怎么完成归还许可证,首先会调用getState()获取信号量当前剩余的许可证,加上外部线程归还的许可证数量算出总许可证数量:current + releases,如果能用CAS的方式修改成功,则退出方法,否则一直轮询直到归还成功,这里CAS失败的原因有可能是外部也在请求和归还许可证,可能在执行完代码<1>处后和执行代码<2>处之前,信号量内部的许可证数量已经变了,所以CAS失败。归还信号量成功后就会调用doReleaseShared(),这个方法前面已经讲解过了,这里就不再赘述了。
public class Semaphore implements java.io.Serializable { //... abstract static class Sync extends AbstractQueuedSynchronizer { //... protected final boolean tryReleaseShared(int releases) { for (;;) { int current = getState();//<1> int next = current + releases; if (next < current) // overflow throw new Error("Maximum permit count exceeded"); if (compareAndSetState(current, next))//<2> return true; } } //... } //... public void release() { sync.releaseShared(1); } //... public void release(int permits) { if (permits < 0) throw new IllegalArgumentException(); sync.releaseShared(permits); } //... } public abstract class AbstractQueuedSynchronizer extends AbstractOwnableSynchronizer implements java.io.Serializable { //... public final boolean releaseShared(int arg) { if (tryReleaseShared(arg)) { doReleaseShared(); return true; } return false; } //... protected boolean tryReleaseShared(int arg) { throw new UnsupportedOperationException(); } //... }
下面我们再来看看tryAcquire(long timeout, TimeUnit unit)和tryAcquire(int permits, long timeout, TimeUnit unit)的实现,这两个方法会在给定的时间范围内尝试获取许可证,如果获取成功则返回true,获取失败则返回false。
这两个方法都会调用AQS实现的tryAcquireSharedNanos(int arg, long nanosTimeout),这个方法其实和先前讲得doAcquireShared(int arg)十分相似,只是多了一个超时返回的功能。
这里笔者简单过一下这个方法的实现:先在代码<1>处算出超时时间,然后封装线程对应的节点Node并将其入队,如果判断节点的前驱节点是头节点,且申请许可证成功,这里会调用setHeadAndPropagate(node, r)将头节点指向当前节点,并尝试唤醒下一个节点对应的线程。如果申请许可证失败,会在<2>处算出还剩多少的阻塞时间nanosTimeout,如果剩余阻塞时间小于等于0,代表线程获取许可证失败,这里会调用<3>处的cancelAcquire(node) 将节点从等待队列中移除,具体的移除逻辑可以看笔者写的ReentrantLock源码解析第二章。如果剩余阻塞时间大于0,则会执行shouldParkAfterFailedAcquire(p, node)将前驱节点的等待状态改为SIGNAL,在第二次循环时,如果前驱节点的状态为SIGNAL,且剩余阻塞时间大于SPIN_FOR_TIMEOUT_THRESHOLD(1000ns),则陷入阻塞,直到被中断抛出异常,或者被唤醒,检查是否能获取许可证,如果不能获取许可证且超时,则会返回false表示在超时时间内没有获取到许可证。
public class Semaphore implements java.io.Serializable { //... public boolean tryAcquire(int permits, long timeout, TimeUnit unit) throws InterruptedException { if (permits < 0) throw new IllegalArgumentException(); return sync.tryAcquireSharedNanos(permits, unit.toNanos(timeout)); } //... public boolean tryAcquire(long timeout, TimeUnit unit) throws InterruptedException { return sync.tryAcquireSharedNanos(1, unit.toNanos(timeout)); } //... } public abstract class AbstractQueuedSynchronizer extends AbstractOwnableSynchronizer implements java.io.Serializable { //... public final boolean tryAcquireSharedNanos(int arg, long nanosTimeout) throws InterruptedException { if (Thread.interrupted()) throw new InterruptedException(); return tryAcquireShared(arg) >= 0 || doAcquireSharedNanos(arg, nanosTimeout); } //... private boolean doAcquireSharedNanos(int arg, long nanosTimeout) throws InterruptedException { if (nanosTimeout <= 0L) return false; final long deadline = System.nanoTime() + nanosTimeout;//<1> final Node node = addWaiter(Node.SHARED); try { for (;;) { final Node p = node.predecessor(); if (p == head) { int r = tryAcquireShared(arg); if (r >= 0) { setHeadAndPropagate(node, r); p.next = null; // help GC return true; } } nanosTimeout = deadline - System.nanoTime();//<2> if (nanosTimeout <= 0L) { cancelAcquire(node);//<3> return false; } if (shouldParkAfterFailedAcquire(p, node) && nanosTimeout > SPIN_FOR_TIMEOUT_THRESHOLD) LockSupport.parkNanos(this, nanosTimeout); if (Thread.interrupted()) throw new InterruptedException(); } } catch (Throwable t) { cancelAcquire(node); throw t; } } //... }
下面我们对照一下FairSync和NonfairSync,其实NonfairSync基本没有什么实现,都是调用其父类Sync的方法,以非公平的方式竞争许可证也是调用其父类nonfairTryAcquireShared(acquires)方法。而FairSync自身是有实现以公平的方式获取许可证,实现逻辑也非常简单。先判断信号量的等待队列是否有节点,有的话则返回获取失败,如果没有再获取当前的可用许可证数量available,扣去申请的许可证数量available - acquires,用CAS的方式把扣减完的值remaining存放进state,由于扣减的时候可能存在其他线程也在申请/归还许可证,所以available的值并非一直有效,如果在获取available后有其他线程也申请和归还许可证,那么这里的CAS很可能会失败,判断CAS失败后,又会开始新的一轮尝试获取许可证逻辑。
static final class FairSync extends Sync { private static final long serialVersionUID = 2014338818796000944L; FairSync(int permits) { super(permits); } protected int tryAcquireShared(int acquires) { for (;;) { if (hasQueuedPredecessors()) return -1; int available = getState(); int remaining = available - acquires; if (remaining < 0 || compareAndSetState(available, remaining)) return remaining; } } } static final class NonfairSync extends Sync { private static final long serialVersionUID = -2694183684443567898L; NonfairSync(int permits) { super(permits); } protected int tryAcquireShared(int acquires) { return nonfairTryAcquireShared(acquires); } }
对照完公平FairSync和非公平NonfairSync的差别后,我们来看看Sync类实现的方法,Sync类的实现其实也不算复杂,主要就下面4个方法,其中:nonfairTryAcquireShared(int acquires)和tryReleaseShared(int releases)先前已经将结果了,下面我们专注:reducePermits(int reductions)和drainPermits()。
abstract static class Sync extends AbstractQueuedSynchronizer { final int nonfairTryAcquireShared(int acquires) { //... } protected final boolean tryReleaseShared(int releases) { //... } final void reducePermits(int reductions) { //... } final int drainPermits() { //... } }
Sync类实现的的reducePermits(int reductions)的作用是降低许可证数量,比如当双11来临时,淘宝京东可以对一些服务进行扩容和配置升级,使得原本可以承受10W并发量的服务提高到可以承受50W,这里可以在不调用acquire()的前提下,调用release()方法增加信号量的许可证,当双11的压力过去后,需要对服务进行缩容,由50W的并发量回到10W,这里可以用reducePermits(int reductions)降低许可证数量。在这个方法中会先获取当前许可证数量,减去我们要扣除的许可证数量current - reductions,并判断其结果是否溢出,如果溢出则抛出异常,没有溢出用CAS的方式设置最新的许可证数量。
public class Semaphore implements java.io.Serializable { //... abstract static class Sync extends AbstractQueuedSynchronizer { //... final void reducePermits(int reductions) { for (;;) { int current = getState(); int next = current - reductions; if (next > current) // underflow throw new Error("Permit count underflow"); if (compareAndSetState(current, next)) return; } } //... } //... protected void reducePermits(int reduction) { if (reduction < 0) throw new IllegalArgumentException(); sync.reducePermits(reduction); } //... }
需要注意两点:
- 这个方法的访问权限是protected,如果要使用此方法需要用一个类去继承,并修改此方法的访问权限。
- 这个方法可能导致信号量的剩余许可证数量为负,比如一个信号量原先的许可证数量为10,且被借走了9个许可证,当前许可证数量为1。这时想把许可证数量从原先的10扣降到3,向reducePermits(int reduction)传入7,此时current-reductions=1-7=-6,如果CAS成功,那么信号量目前的许可证数量为-6,不过没关系,如果前面借走的9个许可证最终会归还,信号量的许可证数量最终会回到3。
class MySemaphore extends Semaphore { public MySemaphore(int permits) { super(permits); } @Override public void reducePermits(int reduction) { super.reducePermits(reduction); } } public static void main(String[] args) { MySemaphore semaphore = new MySemaphore(8); System.out.println("初始信号量的许可证数量:" + semaphore.availablePermits()); //初始化完信号量后,增加信号量的许可证数量 int add = 2; semaphore.release(add); System.out.printf("增加%d个许可证后,许可证数量:%d\n", add, semaphore.availablePermits()); //申请9个许可证 int permits = 9; try { semaphore.acquire(permits); System.out.printf("申请%d个许可证后剩余许可证数量:%d\n", permits, semaphore.availablePermits()); } catch (InterruptedException e) { e.printStackTrace(); } //这里要将原先10个许可证扣除到只剩3个,所以传入7,扣除7个许可证 semaphore.reducePermits(7); System.out.println("扣除7个许可证数量后,剩余许可证数量:" + semaphore.availablePermits()); //归还原先出借的9个许可证 semaphore.release(permits); System.out.printf("归还原先出借的%d信号量后,剩余信号量:%d\n", permits, semaphore.availablePermits()); }
执行结果:
初始信号量的许可证数量:8 增加2个许可证后,许可证数量:10 申请9个许可证后剩余许可证数量:1 扣除7个许可证数量后,剩余许可证数量:-6 归还原先出借的9信号量后,剩余信号量:3
Sync类实现的drainPermits()可以一次性扣除信号量目前所有的许可证数量并返回,通过这个API,我们可以得知资源目前最大的访问限度。还是拿上一章远程服务为例,判定服务能承受的并发是5000,用于限流的semaphore信号量的最大许可证数量也是5000。假设目前信号量剩余的许可证数量为2000,即有3000个线程正在并发访问远程服务,我们可以通过drainPermits()方法获取剩余的允许访问数量2000,然后创建2000个线程访问远程服务,这个API一般用于计算量大且计算内容比较独立的场景。
public class Semaphore implements java.io.Serializable { //... abstract static class Sync extends AbstractQueuedSynchronizer { //... final int drainPermits() { for (;;) { int current = getState(); if (current == 0 || compareAndSetState(current, 0)) return current; } } //... } //... public int drainPermits() { return sync.drainPermits(); } //... }
最后,笔者介绍一个Semaphore在JDK1.6.0_17时期的BUG,便结束对Semaphore的源码解析。
当时AQS的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg) 两个方法的实现是下面这样的,这个代码可能导致队列被阻塞。
private void setHeadAndPropagate(Node node, int propagate) { setHead(node); if (propagate > 0 && node.waitStatus != 0) { Node s = node.next; if (s == null || s.isShared()) unparkSuccessor(node); } } public final boolean releaseShared(int arg) { if (tryReleaseShared(arg)) { Node h = head; if (h != null && h.waitStatus != 0) unparkSuccessor(h); return true; } return false; }
按照上面代码的实现,会让下面的代码出现队列被阻塞的情况。t1和t2线程用于请求许可证,t3和t4线程用于归还许可证,循环10000000次只是为了增加出现阻塞的概率,现在说说什么样的场景下会出现队列被阻塞的情况。
程序开始时,信号量的许可证数量为0,所以t1和t2只能进入队列等待,t1和t2在队列中的节点对应N1和N2,节点的排序为:head->N1->N2(tail)。t3归还许可证时发现头节点不为null且头节点的等待状态为SIGNAL,于是会调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。
t1被唤醒后获取到许可证,返回剩余许可证数量为0,即之后调用setHeadAndPropagate(Node node, int propagate)方法传入的propagate为0,但尚未调用。此时t4也归还了许可证,但发现head节点的等待状态为0,就不会调用unparkSuccessor(h)。
t1执行setHeadAndPropagate(Node node, int propagate),将头节点指向自身线程对应的节点N1,虽然此时信号量里有剩余的许可证,但t1原先拿到的propagate为0,所以不会执行unparkSuccessor(node)唤醒t4。
那么新版本的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg)又是如何保证有许可证被归还时唤醒队列中被阻塞的线程呢?这里其实和PROPAGATE有关,让我们按照新版的setHeadAndPropagate和releaseShared走一遍上面的流程。
t1和t2进入队列中等待,t3归还许可证发现头节点不为null,且头节点等待状态为SIGNAL,于是调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。
t1被唤醒后获取到许可证,返回剩余许可证数量为0,在调用setHeadAndPropagate(Node node, int propagate)之前,t4归还了许可证,发现头节点的等待状态为0,将其改为PROPAGATE。
t1执行setHeadAndPropagate(Node node, int propagate),获取原先头节点h,并将头节点指向N1,此时虽然propagate为0,但原先头节点h的等待状态<0,可以执行doReleaseShared()唤醒后继节点N2对应的线程t2。
import java.util.concurrent.Semaphore; public class TestSemaphore { private static Semaphore sem = new Semaphore(0); private static class Thread1 extends Thread { @Override public void run() { sem.acquireUninterruptibly(); } } private static class Thread2 extends Thread { @Override public void run() { sem.release(); } } public static void main(String[] args) throws InterruptedException { for (int i = 0; i < 10000000; i++) { Thread t1 = new Thread1(); Thread t2 = new Thread1(); Thread t3 = new Thread2(); Thread t4 = new Thread2(); t1.start(); t2.start(); t3.start(); t4.start(); t1.join(); t2.join(); t3.join(); t4.join(); System.out.println(i); } } }
至此,Semaphore的源码解析就到此结束了。笔者在这里并没有全部介绍完所有Semaphore的API,例如:acquireUninterruptibly()和acquireUninterruptibly(int permits),因为这两个方法实在与之前介绍的acquire(),如果大家能理解清楚前面讲解的内容,这两个API相信对大家不在话下。
本章我们也初次见到AQS内部类Node的不同状态和使用方式,即节点除了独占(Node.EXCLUSIVE),还会有共享的状态(Node.SHARED),这里我们也首次见到等待状态为PROPAGATE的节点,代表传播的意思,通过这个状态,不但可以提升信号量整体的吞吐量,还可以避免高并发场景下节点没有被唤醒的情况。