ThreadPoolExecutor的execute源码分析
上一篇文章指出,ThreadPoolExecutor执行的步骤如下:
-
向线程池中添加任务,当任务数量少于corePoolSize时,会自动创建thead来处理这些任务;
-
当添加任务数大于corePoolSize且少于maximmPoolSize时,不再创建线程,而是将这些任务放到阻塞队列中,等待被执行;
-
接上面2的条件,且当阻塞队列满了之后,继续创建thread,从而加速处理阻塞队列;
-
当添加任务大于maximmPoolSize时,根据饱和策略决定是否容许继续向线程池中添加任务,默认的饱和策略是AbortPolicy(直接丢弃)。
我们直接可以通过ThreadPoolExecutor的execute方法源码来跟踪这个流程。首先,由于在execute方法中常常会根据线程池的状态选择判断一些逻辑,因此在介绍该方法之前首先说一下线程池的几种方法。
1. 线程池的状态:
-
RUNNING:该状态的线程池会接收新任务,也会处理在阻塞队列中等待处理的任务;
-
SHUTDOWN:该状态的线程池不会再接收新任务,但还会处理已经提交到阻塞队列中等待处理的任务;
-
STOP:该状态的线程池不会再接收新任务,不会处理在阻塞队列中等待的任务,而且还会中断正在运行的任务;
-
TIDYING:所有任务都被终止了,workerCount为0,为此状态时还将调用terminated()方法;
-
TERMINATED:terminated()方法调用完成后变成此状态。
几个状态相关的方法:
runStateOf(int c) 方法:c & 高3位为1,低29位为0的~CAPACITY,用于获取高3位保存的线程池状态
workerCountOf(int c) 方法:c & 高3位为0,低29位为1的CAPACITY,用于获取低29位的线程数量
ctlOf(int rs, int wc) 方法:参数rs表示runState,参数wc表示workerCount,即根据runState和workerCount打包合并成ctl
也就是说32位含义:(高三位表示状态)+ (低29位表示线程数量)。
接下来分析源码:
2. execute代码
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
/*
* Proceed in 3 steps:
*
* 1. 如果运行的线程少于corePoolSize,
* 尝试开启一个新线程去运行command,command作为这个线程的第一个任务,并运行
*
* 2. 如果任务成功放入队列,我们仍需要一个双重校验去确认是否应该新建一个线程
*(因为可能存在有些线程在我们上次检查后死了),或者进入这个方法后,pool被关闭了
* 所以我们需要再次检查state,如果线程池停止了需要回滚入队列,
* 如果池中没有线程了,新开启 一个线程
*
* 3. 如果无法将任务入队列(可能队列满了),需要新开区一个线程
* 如果失败了,说明线程池shutdown或者饱和了,所以我们拒绝任务
*/
// 1.当运行的线程少于corePoolSize,
// 则直接执行command任务,addworker(command,true)会产生一个新线程来执行这个任务
int c = ctl.get();
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
c = ctl.get();
}
// 2. 线程池处于RUNNING状态,并将任务放入workQueue队列,但不执行addWorker(表明不创建新的线程)
// 双重校验可防止添加任务到workQueue队列后,线程池状态由于意外等原因处于非RUNNING状态,
// 此时就需要从workQueue队列remove掉这个任务
// 注:offer方法不会阻塞,如果不能插入队列直接返回false。(有可能造成数据丢失?这里不会,也就是说阻塞队列满了)
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
// 3. 如果线程池不是running状态或者无法入队列,执行线程池的饱和策略
else if (!addWorker(command, false))
reject(command);
}
从上面代码可知,java线程池在任务比较少时(当运行的线程少于corePoolSize),直接通过addWorker来执行任务,当任务比较多时,使用了阻塞队列,阻塞队列里存放的是Worker对象,Worker类是ThreadPoolExecutor的一个内部类,它实现了Runable接口,具有线程的功能。同时还继承了AbstractQueuedSynchronizer(AQS),因此也具有锁的功能。那么ThreadPoolExecutor中如何去执行阻塞队列里面的Worker任务的呢?首先我们来分析一下doWorker,看它是如何执行任务,以及如何触发执行阻塞队列里面的任务的。
3. doWorker代码
doWorker的的作用首先是创建线程,然后执行任务,源码如下:
private boolean addWorker(Runnable firstTask, boolean core) {
retry:
for (;;) {
int c = ctl.get();
// 获取线程池运行状态,
// 线程池的运行状态:runnbale=-1,shutdown=0,stop=1,tidying=2,terminated=3
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
// CAS算法
for (;;) {
int wc = workerCountOf(c);
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
// 如果添加任务成功,则跳出retry,也就是跳出整个循环体
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // Re-read ctl
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
w = new Worker(firstTask);
// 通过线程池的ThreadFactory创建一个线程,用于执行这个firstTask任务
final Thread t = w.thread;
if (t != null) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int rs = runStateOf(ctl.get());
// 说明:(rs == SHUTDOWN && firstTask == null)可能是workQueue中仍有未执行完成的任务,
// 创建没有初始任务的worker线程执行
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
// 提前检查t线程是否启动,如果是就抛非法线程状态异常
if (t.isAlive())
throw new IllegalThreadStateException();
// workQueue队列中添加Worker对象
workers.add(w);
int s = workers.size();
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
// 往HashSet中添加worker成功,启动线程
if (workerAdded) {
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
代码看起来有点长,但只做了两件事:
1)用循环CAS操作来将线程数加1;
2)新建一个线程并启执行这个任务。
代码中使用的retry,它类似与goto, 用于控制跳出循环体,retry可以随意命名,只要遵循java的命名规则即可。
CAS会使用循环机制,当存在多线程的情况下,通过比较与交换,其它线程通过循环可以的更新最新值。关于CAS可以参考《深入浅出CAS》
在上面源码中可以看到,addWorker会用当前firstTask创建一个Worker对象,相当于对firstTask的包装,然后用Worker对象作为firstTask创建一个Thread,该Thread保存在Worker的thread成员变量中。在addWorker中通过t.start()启动了这个线程,线程中执行runWorker方法。
4. 内部类Worker
那么ThreadPoolExecutor中如何去执行阻塞队列里面的Worker任务的呢?看到这里好像还是没有答案。那接着分析Worker这个内部类:
private final class Worker extends AbstractQueuedSynchronizer implements Runnable{
private static final long serialVersionUID = 6138294804551838833L;
/** Thread this worker is running in. Null if factory fails. */
final Thread thread;
/** Initial task to run. Possibly null. */
Runnable firstTask;
/** Per-thread task counter */
volatile long completedTasks;
/**
* Creates with given first task and thread from ThreadFactory.
*/
Worker(Runnable firstTask) {
// 设置AQS的同步状态,大于0代表锁已经被获取
setState(-1); // inhibit interrupts until runWorker
this.firstTask = firstTask;
this.thread = getThreadFactory().newThread(this);
}
/** Delegates main run loop to outer runWorker */
public void run() {
// 调用ThreadPoolExecutor的runworker方法
runWorker(this);
}
// Lock methods
//
// The value 0 represents the unlocked state.
// The value 1 represents the locked state.
protected boolean isHeldExclusively() {
return getState() != 0;
}
protected boolean tryAcquire(int unused) {
if (compareAndSetState(0, 1)) {
setExclusiveOwnerThread(Thread.currentThread());
return true;
}
return false;
}
protected boolean tryRelease(int unused) {
setExclusiveOwnerThread(null);
setState(0);
return true;
}
public void lock() { acquire(1); }
public boolean tryLock() { return tryAcquire(1); }
public void unlock() { release(1); }
public boolean isLocked() { return isHeldExclusively(); }
void interruptIfStarted() {
Thread t;
if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
try {
t.interrupt();
} catch (SecurityException ignore) {
}
}
}
}
在addWorker中通过t.start()启动了这个线程,线程中执行runWorker方法。
5. runWorker代码
到目前为止还是没有涉及到阻塞队列!可是到runWorker中就可以看到啦!
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
while (task != null || (task = getTask()) != null) {
w.lock();
// If pool is stopping, ensure thread is interrupted;
// if not, ensure thread is not interrupted. This
// requires a recheck in second case to deal with
// shutdownNow race while clearing interrupt
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
beforeExecute(wt, task);
Throwable thrown = null;
try {
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown);
}
} finally {
task = null;
w.completedTasks++;
w.unlock();
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
上面代码关键点是while循环
和getTask()
方法,通过循环不断的调用getTask()从阻塞队列中获取任务,通过这个方法,它与阻塞队列建立桥梁。目前我们已经知道当添加任务数量大于coolPoolSize(且小于maximumPoolSize)的时候,并不会创建线程,但是由于在任务数量小于coolPoolSize之前调用了addWorker并触发t.star()执行,从而调用了runWorker,通过循环不断的调用getTask()从阻塞队列中获取任务,如果getTask()返回不为null,则上锁,执行任务,任务执行完成之后解锁。如果getTask()返回null,改变completedAbrutly状态,然后调用processWorkerExit() 退出worker线程。
6. getTask代码
由第5点引出了getTask方法。
private Runnable getTask() {
boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
// Are workers subject to culling?
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
getTask中主要看获取任务的代码如下:
- workQueue.poll():如果在keepAliveTime时间内,阻塞队列中没有任务,返回null;
- workQueue.take():如果阻塞队列为空,当前线程会被阻塞;当队列中有任务加入时,线程被唤醒,并返回任务。
6. 小结
本文只是对线程池正常的工作流程进行了分析,并没有对线程池shutdown或者stop的情况进行分析,这些部分涉及到AQS等并发技术,这部分比较复杂,感兴趣可以更加深入研究一下。
参考: