Java并发之Semaphore源码解析(二)

在上一章,我们学习了信号量(Semaphore)是如何请求许可证的,下面我们来看看要如何归还许可证。

可以看到当我们要归还许可证时,不论是调用release()或是release(int permits),都会调用AQS实现的releaseShared(int arg)方法。在releaseShared(int arg)方法中会先调用子类实现的tryReleaseShared(int arg)方法,这个方法会向信号量归还许可证,在归还完毕后,会调用doReleaseShared()方法尝试唤醒信号量等待队列中需要许可证的线程,这也印证了笔者之前所说的线程在归还信号量后,会尝试唤醒等待队列中等待许可证的线程。

那我们来看看信号量(Semaphore)静态内部类Sync实现的tryReleaseShared(int releases)是怎么完成归还许可证,首先会调用getState()获取信号量当前剩余的许可证,加上外部线程归还的许可证数量算出总许可证数量:current + releases,如果能用CAS的方式修改成功,则退出方法,否则一直轮询直到归还成功,这里CAS失败的原因有可能是外部也在请求和归还许可证,可能在执行完代码<1>处后和执行代码<2>处之前,信号量内部的许可证数量已经变了,所以CAS失败。归还信号量成功后就会调用doReleaseShared(),这个方法前面已经讲解过了,这里就不再赘述了。

public class Semaphore implements java.io.Serializable {
	//...
	abstract static class Sync extends AbstractQueuedSynchronizer {
		//...
        protected final boolean tryReleaseShared(int releases) {
            for (;;) {
                int current = getState();//<1>
                int next = current + releases;
                if (next < current) // overflow
                    throw new Error("Maximum permit count exceeded");
                if (compareAndSetState(current, next))//<2>
                    return true;
            }
        }
		//...
	}
	//...
    public void release() {
        sync.releaseShared(1);
    }
	//...
    public void release(int permits) {
        if (permits < 0) throw new IllegalArgumentException();
        sync.releaseShared(permits);
    }
	//...
}

public abstract class AbstractQueuedSynchronizer
    extends AbstractOwnableSynchronizer
    implements java.io.Serializable {
	//...
    public final boolean releaseShared(int arg) {
        if (tryReleaseShared(arg)) {
            doReleaseShared();
            return true;
        }
        return false;
    }
	//...
	protected boolean tryReleaseShared(int arg) {
        throw new UnsupportedOperationException();
    }
	//...
}

  

下面我们再来看看tryAcquire(long timeout, TimeUnit unit)和tryAcquire(int permits, long timeout, TimeUnit unit)的实现,这两个方法会在给定的时间范围内尝试获取许可证,如果获取成功则返回true,获取失败则返回false。

这两个方法都会调用AQS实现的tryAcquireSharedNanos(int arg, long nanosTimeout),这个方法其实和先前讲得doAcquireShared(int arg)十分相似,只是多了一个超时返回的功能。

这里笔者简单过一下这个方法的实现:先在代码<1>处算出超时时间,然后封装线程对应的节点Node并将其入队,如果判断节点的前驱节点是头节点,且申请许可证成功,这里会调用setHeadAndPropagate(node, r)将头节点指向当前节点,并尝试唤醒下一个节点对应的线程。如果申请许可证失败,会在<2>处算出还剩多少的阻塞时间nanosTimeout,如果剩余阻塞时间小于等于0,代表线程获取许可证失败,这里会调用<3>处的cancelAcquire(node) 将节点从等待队列中移除,具体的移除逻辑可以看笔者写的ReentrantLock源码解析第二章。如果剩余阻塞时间大于0,则会执行shouldParkAfterFailedAcquire(p, node)将前驱节点的等待状态改为SIGNAL,在第二次循环时,如果前驱节点的状态为SIGNAL,且剩余阻塞时间大于SPIN_FOR_TIMEOUT_THRESHOLD(1000ns),则陷入阻塞,直到被中断抛出异常,或者被唤醒,检查是否能获取许可证,如果不能获取许可证且超时,则会返回false表示在超时时间内没有获取到许可证。

public class Semaphore implements java.io.Serializable {
	//...
    public boolean tryAcquire(int permits, long timeout, TimeUnit unit)
        throws InterruptedException {
        if (permits < 0) throw new IllegalArgumentException();
        return sync.tryAcquireSharedNanos(permits, unit.toNanos(timeout));
    }
	//...
    public boolean tryAcquire(long timeout, TimeUnit unit)
        throws InterruptedException {
        return sync.tryAcquireSharedNanos(1, unit.toNanos(timeout));
    }
	//...
}

public abstract class AbstractQueuedSynchronizer
    extends AbstractOwnableSynchronizer
    implements java.io.Serializable {
	//...
    public final boolean tryAcquireSharedNanos(int arg, long nanosTimeout)
            throws InterruptedException {
        if (Thread.interrupted())
            throw new InterruptedException();
        return tryAcquireShared(arg) >= 0 ||
            doAcquireSharedNanos(arg, nanosTimeout);
    }
	//...
    private boolean doAcquireSharedNanos(int arg, long nanosTimeout)
            throws InterruptedException {
        if (nanosTimeout <= 0L)
            return false;
        final long deadline = System.nanoTime() + nanosTimeout;//<1>
        final Node node = addWaiter(Node.SHARED);
        try {
            for (;;) {
                final Node p = node.predecessor();
                if (p == head) {
                    int r = tryAcquireShared(arg);
                    if (r >= 0) {
                        setHeadAndPropagate(node, r);
                        p.next = null; // help GC
                        return true;
                    }
                }
                nanosTimeout = deadline - System.nanoTime();//<2>
                if (nanosTimeout <= 0L) {
                    cancelAcquire(node);//<3>
                    return false;
                }
                if (shouldParkAfterFailedAcquire(p, node) &&
                    nanosTimeout > SPIN_FOR_TIMEOUT_THRESHOLD)
                    LockSupport.parkNanos(this, nanosTimeout);
                if (Thread.interrupted())
                    throw new InterruptedException();
            }
        } catch (Throwable t) {
            cancelAcquire(node);
            throw t;
        }
    }
	//...
}

 

下面我们对照一下FairSync和NonfairSync,其实NonfairSync基本没有什么实现,都是调用其父类Sync的方法,以非公平的方式竞争许可证也是调用其父类nonfairTryAcquireShared(acquires)方法。而FairSync自身是有实现以公平的方式获取许可证,实现逻辑也非常简单。先判断信号量的等待队列是否有节点,有的话则返回获取失败,如果没有再获取当前的可用许可证数量available,扣去申请的许可证数量available - acquires,用CAS的方式把扣减完的值remaining存放进state,由于扣减的时候可能存在其他线程也在申请/归还许可证,所以available的值并非一直有效,如果在获取available后有其他线程也申请和归还许可证,那么这里的CAS很可能会失败,判断CAS失败后,又会开始新的一轮尝试获取许可证逻辑。

static final class FairSync extends Sync {
	private static final long serialVersionUID = 2014338818796000944L;

	FairSync(int permits) {
		super(permits);
	}

	protected int tryAcquireShared(int acquires) {
		for (;;) {
			if (hasQueuedPredecessors())
				return -1;
			int available = getState();
			int remaining = available - acquires;
			if (remaining < 0 ||
				compareAndSetState(available, remaining))
				return remaining;
		}
	}
}

static final class NonfairSync extends Sync {
	private static final long serialVersionUID = -2694183684443567898L;

	NonfairSync(int permits) {
		super(permits);
	}

	protected int tryAcquireShared(int acquires) {
		return nonfairTryAcquireShared(acquires);
	}
}

    

对照完公平FairSync和非公平NonfairSync的差别后,我们来看看Sync类实现的方法,Sync类的实现其实也不算复杂,主要就下面4个方法,其中:nonfairTryAcquireShared(int acquires)和tryReleaseShared(int releases)先前已经将结果了,下面我们专注:reducePermits(int reductions)和drainPermits()。

abstract static class Sync extends AbstractQueuedSynchronizer {
	final int nonfairTryAcquireShared(int acquires) {
		//...
	}
	protected final boolean tryReleaseShared(int releases) {
		//...
	}
	final void reducePermits(int reductions) {
		//...
	}
	final int drainPermits() {
		//...
	}
}

  

Sync类实现的的reducePermits(int reductions)的作用是降低许可证数量,比如当双11来临时,淘宝京东可以对一些服务进行扩容和配置升级,使得原本可以承受10W并发量的服务提高到可以承受50W,这里可以在不调用acquire()的前提下,调用release()方法增加信号量的许可证,当双11的压力过去后,需要对服务进行缩容,由50W的并发量回到10W,这里可以用reducePermits(int reductions)降低许可证数量。在这个方法中会先获取当前许可证数量,减去我们要扣除的许可证数量current - reductions,并判断其结果是否溢出,如果溢出则抛出异常,没有溢出用CAS的方式设置最新的许可证数量。

public class Semaphore implements java.io.Serializable {
	//...
    abstract static class Sync extends AbstractQueuedSynchronizer {
		//...
        final void reducePermits(int reductions) {
            for (;;) {
                int current = getState();
                int next = current - reductions;
                if (next > current) // underflow
                    throw new Error("Permit count underflow");
                if (compareAndSetState(current, next))
                    return;
            }
        }
		//...
	}
	//...
	protected void reducePermits(int reduction) {
        if (reduction < 0) throw new IllegalArgumentException();
        sync.reducePermits(reduction);
    }
	//...
}

  

需要注意两点:

  1. 这个方法的访问权限是protected,如果要使用此方法需要用一个类去继承,并修改此方法的访问权限。
  2. 这个方法可能导致信号量的剩余许可证数量为负,比如一个信号量原先的许可证数量为10,且被借走了9个许可证,当前许可证数量为1。这时想把许可证数量从原先的10扣降到3,向reducePermits(int reduction)传入7,此时current-reductions=1-7=-6,如果CAS成功,那么信号量目前的许可证数量为-6,不过没关系,如果前面借走的9个许可证最终会归还,信号量的许可证数量最终会回到3。
class MySemaphore extends Semaphore {
	public MySemaphore(int permits) {
		super(permits);
	}

	@Override
	public void reducePermits(int reduction) {
		super.reducePermits(reduction);
	}
}

public static void main(String[] args) {
	MySemaphore semaphore = new MySemaphore(8);
	System.out.println("初始信号量的许可证数量:" + semaphore.availablePermits());
	//初始化完信号量后,增加信号量的许可证数量
	int add = 2;
	semaphore.release(add);
	System.out.printf("增加%d个许可证后,许可证数量:%d\n", add, semaphore.availablePermits());
	//申请9个许可证
	int permits = 9;
	try {
		semaphore.acquire(permits);
		System.out.printf("申请%d个许可证后剩余许可证数量:%d\n", permits, semaphore.availablePermits());
	} catch (InterruptedException e) {
		e.printStackTrace();
	}
	//这里要将原先10个许可证扣除到只剩3个,所以传入7,扣除7个许可证
	semaphore.reducePermits(7);
	System.out.println("扣除7个许可证数量后,剩余许可证数量:" + semaphore.availablePermits());
	//归还原先出借的9个许可证
	semaphore.release(permits);
	System.out.printf("归还原先出借的%d信号量后,剩余信号量:%d\n", permits, semaphore.availablePermits());
}

    

执行结果:

初始信号量的许可证数量:8
增加2个许可证后,许可证数量:10
申请9个许可证后剩余许可证数量:1
扣除7个许可证数量后,剩余许可证数量:-6
归还原先出借的9信号量后,剩余信号量:3

  

Sync类实现的drainPermits()可以一次性扣除信号量目前所有的许可证数量并返回,通过这个API,我们可以得知资源目前最大的访问限度。还是拿上一章远程服务为例,判定服务能承受的并发是5000,用于限流的semaphore信号量的最大许可证数量也是5000。假设目前信号量剩余的许可证数量为2000,即有3000个线程正在并发访问远程服务,我们可以通过drainPermits()方法获取剩余的允许访问数量2000,然后创建2000个线程访问远程服务,这个API一般用于计算量大且计算内容比较独立的场景。

public class Semaphore implements java.io.Serializable {
	//...
    abstract static class Sync extends AbstractQueuedSynchronizer {
		//...
        final int drainPermits() {
            for (;;) {
                int current = getState();
                if (current == 0 || compareAndSetState(current, 0))
                    return current;
            }
        }
		//...
	}
	//...
    public int drainPermits() {
        return sync.drainPermits();
    }
	//...
}

 

最后,笔者介绍一个Semaphore在JDK1.6.0_17时期的BUG,便结束对Semaphore的源码解析。

当时AQS的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg) 两个方法的实现是下面这样的,这个代码可能导致队列被阻塞。

private void setHeadAndPropagate(Node node, int propagate) {
	setHead(node);
	if (propagate > 0 && node.waitStatus != 0) {
		Node s = node.next;
		if (s == null || s.isShared())
			unparkSuccessor(node);
	}
}

public final boolean releaseShared(int arg) {
	if (tryReleaseShared(arg)) {
		Node h = head;
		if (h != null && h.waitStatus != 0)
			unparkSuccessor(h);
		return true;
	}
	return false;
}

  

按照上面代码的实现,会让下面的代码出现队列被阻塞的情况。t1和t2线程用于请求许可证,t3和t4线程用于归还许可证,循环10000000次只是为了增加出现阻塞的概率,现在说说什么样的场景下会出现队列被阻塞的情况。

程序开始时,信号量的许可证数量为0,所以t1和t2只能进入队列等待,t1和t2在队列中的节点对应N1和N2,节点的排序为:head->N1->N2(tail)。t3归还许可证时发现头节点不为null且头节点的等待状态为SIGNAL,于是会调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。

t1被唤醒后获取到许可证,返回剩余许可证数量为0,即之后调用setHeadAndPropagate(Node node, int propagate)方法传入的propagate为0,但尚未调用。此时t4也归还了许可证,但发现head节点的等待状态为0,就不会调用unparkSuccessor(h)。

t1执行setHeadAndPropagate(Node node, int propagate),将头节点指向自身线程对应的节点N1,虽然此时信号量里有剩余的许可证,但t1原先拿到的propagate为0,所以不会执行unparkSuccessor(node)唤醒t4。

那么新版本的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg)又是如何保证有许可证被归还时唤醒队列中被阻塞的线程呢?这里其实和PROPAGATE有关,让我们按照新版的setHeadAndPropagate和releaseShared走一遍上面的流程。

t1和t2进入队列中等待,t3归还许可证发现头节点不为null,且头节点等待状态为SIGNAL,于是调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。

t1被唤醒后获取到许可证,返回剩余许可证数量为0,在调用setHeadAndPropagate(Node node, int propagate)之前,t4归还了许可证,发现头节点的等待状态为0,将其改为PROPAGATE。

t1执行setHeadAndPropagate(Node node, int propagate),获取原先头节点h,并将头节点指向N1,此时虽然propagate为0,但原先头节点h的等待状态<0,可以执行doReleaseShared()唤醒后继节点N2对应的线程t2。

import java.util.concurrent.Semaphore;

public class TestSemaphore {

    private static Semaphore sem = new Semaphore(0);

    private static class Thread1 extends Thread {
        @Override
        public void run() {
            sem.acquireUninterruptibly();
        }
    }

    private static class Thread2 extends Thread {
        @Override
        public void run() {
            sem.release();
        }
    }

    public static void main(String[] args) throws InterruptedException {
        for (int i = 0; i < 10000000; i++) {
            Thread t1 = new Thread1();
            Thread t2 = new Thread1();
            Thread t3 = new Thread2();
            Thread t4 = new Thread2();
            t1.start();
            t2.start();
            t3.start();
            t4.start();
            t1.join();
            t2.join();
            t3.join();
            t4.join();
            System.out.println(i);
        }
    }
}

   

至此,Semaphore的源码解析就到此结束了。笔者在这里并没有全部介绍完所有Semaphore的API,例如:acquireUninterruptibly()和acquireUninterruptibly(int permits),因为这两个方法实在与之前介绍的acquire(),如果大家能理解清楚前面讲解的内容,这两个API相信对大家不在话下。

本章我们也初次见到AQS内部类Node的不同状态和使用方式,即节点除了独占(Node.EXCLUSIVE),还会有共享的状态(Node.SHARED),这里我们也首次见到等待状态为PROPAGATE的节点,代表传播的意思,通过这个状态,不但可以提升信号量整体的吞吐量,还可以避免高并发场景下节点没有被唤醒的情况。

 

posted @ 2021-07-04 18:09  北洛  阅读(270)  评论(0编辑  收藏  举报