线程池：ThreadPoolExecutor源码解读

1 带着问题去阅读

1.1 线程池的线程复用原理

用户每次调用execute()来提交一个任务，然后任务包装成Worker对象，并且启动一个worker线程来执行任务（任务可能会被先加入队列），只要任务队列不为空且worker线程没有被中断，线程的run()方法通过一个while循环，不断去队列获取任务并执行，而不会进入到run()方法底部。while循环是线程复用的关键

1.2 线程池如何管理线程

首先定义两个说明：

关于获取任务超时，会依赖以下条件:

--1、开启核心线程超时设置或线程池线程数大于核心线程数
--2、符合1，且从workqueue获取任务超时。（如果不符合1，则以阻塞方式获取任务，不会超时）
线程池最小保留线程数：
--1、如果没有开启核心线程超时配置，则至少保留corePoolSize个线程
--2、如果开启核心线程超时并且当前队列里面还有任务，只需保留1个线程

将线程池的生命周期分为三个阶段：创建阶段、运行期间、终止阶段。
一、创建阶段

当线程池线程数（ctl低位）少于核心线程数（corePoolSize），创建新线程执行任务
当线程池线程数大于等于核心线程数，且任务队列未满时，将新任务放入到任务队列中，不创建线程
当线程池线程数大于等于核心线程数（maximumPoolSize），且任务队列已满
--如果工作线程数少于最大线程数，则创建新线程执行任务
--如果工作线程数等于最大线程数，则抛出异常，拒绝新任务进入
二、运行期间
1、线程启动后，将一直循环获取任务并执行，只有当获取任务超时，或者线程池被终止，才会结束。
2、如果获取任务超时，那么Worker线程自然结束。此时线程池减少了1个线程。
3、在线程结束后，线程池会检查：1、线程池线程数<最少保留线程数 2、任务执行异常结束。如果符合，线程池会自动补充1个Worker

三、终止阶段
调用shutdown()和shutdownNow()都导致线程池线程数减少。
1、shutdown()方式终止线程池：
--停止提交新的任务，已在队列的任务会继续执行，并且中断空闲的Worker线程(Work.state从0->1成功)，线程池状态变为SHUTDOWN
2、shutdownNow()方式终止线程池：
--关闭线程池，不再接受新的任务，中断已经启动的Worker线程（Work.state>0），线程池状态改为STOP

线程池创建线程及处理任务过程：

梳理一下大概流程：

用户线程调用execute()提交Runnable任务
execute()调用addWork()将任务提交给线程池处理：如果有可用的核心线程，则提交给核心线程处理。反则，将任务先添加到任务队列（workQueen）中。
addWorker()方法将启动一个worker线程，调用runWorker()来处理任务。
runWorker()方法将循环获取任务，并运行任务的run()方法来执行真正的业务。如果是以核心线程提交任务，则优先处理该任务，否则，循环调用getTask()来获取任务
getTask()方法，从任务队列（workQueen）取出任务，并返回。
getTask()没有拿到任务，则执行线程结束processWorkerExit()

线程池创建阶段：

1.3 线程池配置的重要参数

ctl：存储线程池状态以及线程数
corePoolSize、maximumPoolSize、keepAliveTime、workQueue 参照下面的源码分析说明
allowCoreThreadTimeOut：是否开启核心线程超时。默认false，不在构造函数设置，需要调用方法设置
HashSet workers：线程池终止时会从该集合找线程来中断，源码分析有说明

1.4 shutdown()和shutdownNow()区别

shutdown() ：关闭线程池，不再接受新的任务，已提交执行的任务继续执行；中断所有空闲线程；将线程池状态改为SHUTDOWN
ShutDownNow()：关闭线程池，不再接受新的任务，中断已经启动的Worker线程；将线程池状态改为STOP；返回未完成的任务队列

1.5 线程池中的两个锁

mainLock主锁是可重入的锁，用来同步更新的成员变量
Worker内部实现了一个锁，它是不可重入的，在shutdown()场景中，通过tryLock确保不会中断还没有开始执行或者还在执行中的worker线程。

2 源码分析过程中的困惑及解惑

---什么情况任务会提交失败？
同时符合以下条件，任务才会被提交：

线程池状态等于RUNNING状态；

如果任务队列已经满了，并且线程池线程数少于配置的线程池最大线程数（maximumPoolSize）且小于线程池的最大支持线程数(CAPACITY)时。（如果队列没满，任务将会先加入到队列中）

特别说明：特殊情况会创建任务为空的Worker线程来帮助队列中的任务跑完

---核心线程数的意义？从测试结果看，他决定了工作线程最大并发数，但未代码验证

核心线程数决定提交任务什么时候会被放入到队列中：即线程池线程数>=核心线程数时。

核心线程数大小跟并发执行线程（任务）无关。也就是，它不决定工作线程最大并发数

核心线程数可以动态修改。（如果增大了，可能会马上创建新的Worker线程）

---线程池状态不是RUNNING,或者往workQueue添加worker失败，这是为什么还要提交任务
以下情况会创建任务为空的Worker线程来执行队列中的任务

当前线程池状态为shutdown，但是任务队列不为空，这时创建Worker线程来帮助执行队列的任务
当前线程池状态为running，任务添加到队列后，接着线程池被关闭，并且从队列移除该任务失败，并且线程池线程数为0，这时创建Worker线程来确保刚提交的任务有机会执行。

---为什么runWorker()方法在执行任务前后加锁，但是线程依然能够并发？

worker线程是通过创建Worker对象来创建的，在addWorke()的while循环创建了多个Worker对象，每个Worker对象都有自己的锁，Worker线程通过runWorker()访问的是当前对象的锁，因此Worker线程能够并发；
锁的意义是限制不能中断执行中的任务，因为主线程调用shutdown()和shutdownNow()方法时，会遍历WorkerSet的Worker对象，调用tryLock()，这时主线程和Worker线程竞争同一个锁。

3 源码分析

3.1 类继承关系

Executo接口：专门提交任务，只有一个execute()方法。Executor 提供了一种将任务的提交和任务的执行两个操作进行解耦的思路：客户端无需关注执行任务的线程是如何创建、运行和回收的，只需要将任务的执行逻辑包装为一个 Runnable 对象传递进来即可，由 Executor 的实现类自己来完成最复杂的执行逻辑
ExecutorService接口：继承了Executor，扩展执行任务的能力。例如：获取任务的执行结果、取消任务等功能；提供了关闭线程池、停止线程池，以及阻塞等待线程池完全终止的方法,需要ThreadPoolExecutor实现
AbstractExecutorServic类：实现了 ExecutorService ，是上层的抽象类，负责将任务的执行流程串联起来，从而使得下层的实现类 ThreadPoolExecutor只需要实现一个执行任务的方法即可
ThreadPoolExecutor：可以看做是基于生产者-消费者模式的一种服务，内部维护的多个线程相当于消费者，提交的任务相当于产品，提交任务的外部就相当于生产者

3.2 类的常量/成员变量

   //--------------------------常量部分------------------------
   
// 常量29。用在移位计算Integer.SIZE=32）
private static final int COUNT_BITS = Integer.SIZE - 3; //29
// 最大支持线程数 2^29-1：000 11111111111111111...
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

// 以下为线程池的四个状态，用32位中的前三位表示
 // 011 terminated() 方法执行完成后,线程池的状态会转为TERMINATED.
private static final int TERMINATED =  3 << COUNT_BITS;
// 010 所有任务都销毁了,workCount=0的时候,线程池的装填在转换为TIDYING是,会执行钩子方法terminated()
private static final int TIDYING    =  2 << COUNT_BITS; //翻译为整理
// 001 拒绝新的任务提交,清空在队列中的任务
private static final int STOP       =  1 << COUNT_BITS;
// 000 拒绝新的任务提交,会将队列中的任务执行完,正在执行的任务继续执行.
private static final int SHUTDOWN   =  0 << COUNT_BITS;
// 111 00000 00000000 00000000 00000000  线程运行中 【running状态值为负数最小】
private static final int RUNNING    = -1 << COUNT_BITS; //线程池的默认状态


//------------------------变量部分------------------------

// ctl存储线程池状态和线程池大小，那么用前3位表示线程池状态，后29位表示：线程池大小，即线程池线程数
//线程池状态初始值为RUNNING
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
//任务队列
//保存不能马上执行的Runnable任务。
//执行shutdownNow()时，会返回还在队列的任务
private final BlockingQueue<Runnable> workQueue;
// 主锁，对workers、largestPoolSize、completedTaskCount的访问都必须先获取该锁
private final ReentrantLock mainLock = new ReentrantLock();

// 包含池中的所有工作线程的集合。持有mainLock访问  
// 创建Worker时，添加到集合
// 线程结束时，从集合移除
// 调用shutdown()时，从该集合中找到空闲线程并中断
// 调用shutdownNow()时，从该集合中找到已启动的线程并中断
private final HashSet<Worker> workers = new HashSet<Worker>();

// 线程通信手段, 用于支持awaitTermination方法：等待所有任务完成,并支持设置超时时间,返回值代表是不是超时.
private final Condition termination = mainLock.newCondition();

// 记录workers历史以来的最大值。持有mainLock访问
// 每次增加worker的时候,都会判断当前workers.size()是否大于最大值，大于则更新
// 用于线程池监控的，作为重要指标
private int largestPoolSize;

// 计数所有已完成任务,持有mainLock访问
// 每个worker都有一个自己的成员变量 completedTasks 来记录当前 worker 执行的任务次数, 当前线worker工作线程终止的时候, 才会将worker中的completedTasks的数量加入到 completedTaskCount 指标中.
private long completedTaskCount;

// 线程工厂
private volatile ThreadFactory threadFactory;

// 拒绝策略,默认四种AbortPolicy、CallerRunsPolicy、DiscardPolicy、DiscardOldestPolicy,建议自己实现,增加监控指标
private volatile RejectedExecutionHandler handler;

// keepAliveTime和allowCoreThreadTimeOut 是关于线程空闲是否会被销毁的配置

// 关于空闲的说明：
// 1、线程池在没有关闭之前，会一直向任务队列（workqueue）获取任务执行，如果任务队列是空的，在新任务提交上来之前，就会产生一个等待时间，期间，线程处于空闲状态
// 2、向任务队列获取任务用：workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS)，表示阻塞式获取元素，等待超时，则终止等待并返回false。通过判断poll()方法是true/falle来判定线程是否超时

// 获取任务的等待时间 ，以下两种情况会使用到该值
//1、如果启用allowCoreThreadTimeOut，那表示核心线程的空闲时间  
// 2、当线程池内线程数超过corePoolSize，表示线程获取任务的等待时间
private volatile long keepAliveTime;

// 核心线程是否开启超时
// false：表示核心线程一旦启动，会一直运行，直至关闭线程池。默认该值
// true：表示核心线程处于空闲且时间超过keepAliveTime，核心线程结束后，将不再创建新线程
// （默认的构造函数没有设置这个属性，需要手工调用allowCoreThreadTimeOut()方法来设置)
private volatile boolean allowCoreThreadTimeOut; 

//核心线程数量
//核心线程是指：线程会一直存活在线程池中，不会被主动销毁【如果核心线程开启超时，有可能被被销毁】。
private volatile int corePoolSize;

// 配置的线程池最大线程数
private volatile int maximumPoolSize;

// 默认拒绝策略 AbortPolicy
private static final RejectedExecutionHandler defaultHandler = new AbortPolicy();

//  安全控制访问（主要用于shutdown和 shutdownNow方法
private static final RuntimePermission shutdownPerm =  new RuntimePermission("modifyThread");

// 在threadPoolExecutor初始化的时候赋值,acc对象是指当前调用上下文的快照，其中包括当前线程继承的AccessControlContext和任何有限的特权范围，使得可以在稍后的某个时间点(可能在另一个线程中)检查此上下文。
private final AccessControlContext acc;

3.3 成员变量访问方法

// 获取当前线程池的状态(前3位)
private static int runStateOf(int c) { return c & ~CAPACITY; }
// 获取当前线程池中线程数(后29位)
private static int workerCountOf(int c){ return c & CAPACITY; }
// 更新状态和数量
private static int ctlOf(int rs, int wc) { return rs | wc; }
// 小于判断C是不是小于S,比如runStateLessThan(var,STOP),那var就只有可能是(RUNNING,SHUTDOWN)
private static boolean runStateLessThan(int c, int s) {
    return c < s;
}
// 是不是C >= S
private static boolean runStateAtLeast(int c, int s) {
    return c >= s;
}
// 判断状态是不是RUNNING
private static boolean isRunning(int c) {
    return c < SHUTDOWN;
}

关于-1<<29说明：

-1 << COUNT_BITS
这里是-1往左移29位，稍微有点不一样，-1的话需要我们自己算出补码来
-1的原码
10000000 00000000 00000000 00000001
-1的反码，负数的反码是将原码除符号位以外全部取反
11111111 11111111 11111111 11111110
-1的补码，负数的补码就是将反码+1
11111111 11111111 11111111 11111111
关键了，往左移29位，所以高3位全是1就是RUNNING状态
111 00000 00000000 00000000 00000000

3.4 构造函数

//corePoolSize、maximumPoolSize、keepAliveTime、unit、workQueue 这五个参数必须指定
//最多参构造函数
public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
       
       //初始值的合法性校验
       if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||  //最大线程数必须大于核心线程数
            keepAliveTime < 0)
            throw new IllegalArgumentException();  
        if (workQueue == null || threadFactory == null || handler == null)
            throw new NullPointerException();
            //成员变量赋初值
        this.acc = System.getSecurityManager() == null ?
                null :
                AccessController.getContext();
        this.corePoolSize = corePoolSize;
        this.maximumPoolSize = maximumPoolSize; 
        this.workQueue = workQueue;//默认使用SynchronousQueue<Runnable>
        this.keepAliveTime = unit.toNanos(keepAliveTime); //默认60S
        this.threadFactory = threadFactory; //默认使用DefaultThreadFactory
        this.handler = handler;
    }

构造函数总结：
初始化：corePoolSize（核心线程池大小）、maximumPoolSize（线程池容纳最大线程数）、workQueue（任务队列）、threadFactory（线程工厂）、keepAliveTime（空闲线程存活时长）、handler（拒绝策略）AccessControlContext

3.5 静态内部类Worker

3.5.1 Worker继承关系

private final class Worker extends AbstractQueuedSynchronizer implements Runnable  {
}

--Worker继承于AbstractQueuedSynchronizer

Worker继承于AQS 为的就是自定义实现不可重入的特性（所以没有使用 synchronized 或者 ReentrantLock）来辅助判断线程是否处于执行任务的状态：在开始执行任务前进行加锁，在任务执行结束后解锁，以便在后续通过判断 Worker 是否处于锁定状态来得知其是否处于执行阶段

-- Worker实现Runnable接口

Worker实现Runnable接口，线程是通过getThreadFactory().newThread(this) 来创建的，即将 Worker 本身作为构造参数传给 Thread 进行初始化，所以在 thread 启动的时候 Worker 的 run() 方法就会被执行。

关于ThreadFactory说明：

public interface ThreadFactory {
    Thread newThread(Runnable r);
}

3.5.2 Worker源码分析

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
    {
        private static final long serialVersionUID = 6138294804551838833L;
       //线程类型的属性：thread，线程池启动工作线程，就是启动这个thread。
       // 1、通过this.thread=getThreadFactory().newThread(this)，初始化了属性thread，this就是指Worker对象
       //2、因为Worker类实现了Runnable接口，所以thread启动后，会运行Worker的run()方法，然后就去执行runWorker(this)方法
        final Thread thread;
        //线程要执行的第1个任务（可能为 null)  它表示这个任务立即执行，不需要放到任务队列。在工作线程数<核心线程数时，这种场景会出现
        Runnable firstTask;
       //保存Worker线程池执行过的任务数，在runWorker()的finally中累加更新。任务执行成功与否都会更新
        volatile long completedTasks;

        Worker(Runnable firstTask) {
            setState(-1); // AQS父类的state。设为-1
            this.firstTask = firstTask;  //firstTask赋初值
            this.thread = getThreadFactory().newThread(this); //属性thread赋值
        }

        //Runnable run方法实现
        public void run() {
            runWorker(this); //调用runWorkder方法：将Worker对象传递给调用者，这样就可以访问firstTask、thread等属性以及lock()相关方法
        }
        
        // state 的值说明
        // -1：worker初始化；  1 ：锁被独占； 0：锁空闲
        
        //是否持有锁 AQS父类方法的实现 
        protected boolean isHeldExclusively() {
            return getState() != 0; 
        }
        //以独占方式获取锁，将state设为1  AQS父类方法的实现 
        protected boolean tryAcquire(int unused) {
            if (compareAndSetState(0, 1)) {
                setExclusiveOwnerThread(Thread.currentThread());
                return true;
            }
            return false; //假如state=1，那么cas失败，返回false，线程就会进入AQS队列等待
        }
        //释放锁。state设为0  AQS父类方法的实现 
        protected boolean tryRelease(int unused) {
            setExclusiveOwnerThread(null);
            setState(0);
            return true;
        }
        //提供加锁和解锁的方法
        public void lock()        { acquire(1); }
        public boolean tryLock()  { return tryAcquire(1); }
        public void unlock()      { release(1); }
        public boolean isLocked() { return isHeldExclusively(); }

        //向线程发起中断请求
        // 符合：1、运行中的；2、没有处于中断   才能中断
        void interruptIfStarted() {
            Thread t;
            if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                }
            }
        }
    }

Worker类总结：

所谓的线程池，其实就是正在运行的多个Worker线程。
Worker作为线程启动后，它实际执行的是通过execute()提交的Runnable任务（实际业务），worker线程通过一个while循环来不断获取并任务，从而达到线程复用的效果
firstTask：线程要执行的第1个任务（可能为 null) 它表示这个任务立即执行，不需要放到任务队列。在 1、线程数<核心线程数 2、队列已满且线程池不在运行状态这两个场景下。

4 重要方法详解

4.1 execute()方法

execute()用来提交要运行的任务

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get(); // 计算当前线程池的状态及线程数
        // 1、线程池线程数小于配置的核心线程数
        if (workerCountOf(c) < corePoolSize) {
         // 将任务提交给核心线程处理
            if (addWorker(command, true)) 
                return;
            //失败的情况：1、线程池已经被关闭、2、线程池线程数大于等于核心线程数 （不能以true的方式提交了 ）
            c = ctl.get(); // 重新获取线程池状态
        }
        
        // 2、无空闲核心线程，将任务加入队列
        
        // 再次确认线程池为RUNNING状态，将任务加入队列【非阻塞式，队列满了会立即返回false】
        if (isRunning(c) && workQueue.offer(command)) {
            //任务加入队列成功
            int recheck = ctl.get() ;//再次获取当前线程池状态(线程池可能被其它线程关闭了)
            //判断当前线程池状态是不是RUNNING状态,不是就从workQueue中删除command任务
            if (! isRunning(recheck) && remove(command))
                reject(command);//执行拒绝策略
              //如果当前线程数是0（那证明还没有其他工作线程去处理这个任务）,那么刚刚的任务肯定在阻塞队列里面了,这
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);//开启一个没有任务的Worker线程去执行队列的任务
        }
        
        // 3 workQueue添加worker失败，即队列满了
        //创建非核心线程并执行任务
        else if (!addWorker(command, false))    //如果线程创建失败，说明要么是线程池当前状态!=RUNNING，或者是任务队列已满且线程总数达到最大线程数了

            reject(command);//执行拒绝策略.
    }

execute()总结

进行三次addWorker的尝试：
addWorker(command, true)：创建任务并以核心线程执行
核心线程数达到上限， 创建任务添加到任务队列，不创建线程
addWorker(null, false) ：任务添加到队列后，接着线程池被关闭，并且从队列移除该任务失败，并且线程池线程数为0，这时创建任务并以非核心线程执行
addWorker(command, false) ：任务队列已满，创建非核心线程并执行
任务提交失败情况：线程池非RUNNING状态 并且 任务队列已满并且线程池线程数达到最大线程数（maximumPoolSize）

4.2 addWorker()方法

//TERMINATED >TIDYING > STOP > SHUTDOWN > RUNNING  
//创建新的线程执行当前任务 
//firstTask: 指定新增线程执行的第一个任务或者不执行任务
private boolean addWorker(Runnable firstTask, boolean core) {
        //外循环：
        retry:
        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

           // 如果线程池状态是SHUTDOWN、STOP、TIDYING、TERMINATED就不允许提交。
           // && 后面的特殊情况，线程池的状态是SHUTDOWN并且要要执行的任务为Null并且队列不是空，这种情况下是允许增加一个线程来帮助队列中的任务跑完的，因为shutdown状态下，允许执行完成阻塞队里中的任务 

            if (rs >= SHUTDOWN &&
                ! (rs == SHUTDOWN &&
                   firstTask == null &&  //execute()有addWorkder(null,false)的场景
                   ! workQueue.isEmpty()))
                return false;
            //内循环：cas修改工作线程数，同时判断能否添加work
            for (;;) {
                int wc = workerCountOf(c);
                //添加任务前，线程池线程数已达到上限，此时不允许添加。上限分这三种情况：
                // 1、最大支持线程数
                // 2、以core=true提交时，配置的核心线程数。（返回false后，会以core=false再提交一次）
                // 3、以core=false提交时，配置的线程池可容纳最大线程数。
                if (wc >= CAPACITY ||
                    wc >= (core ? corePoolSize : maximumPoolSize)) //使用core则上限为核心线程数，否则最大线程数
                    return false;
               //没超过上限，通过CAS的方式增加worker的数量（+1），增加成功就跳出外层循环
               if (compareAndIncrementWorkerCount(c))
                    break retry;
                c = ctl.get();  //获取最新的线程池状态，与刚开始的状态比较
                  // - 变了，就从外层循环重新执行，重新进行状态的检查。
                // - 没变，从当前循环重新执行，重新执行CAS操作。
                if (runStateOf(c) != rs) 
                    continue retry;
            }
        }

        boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
            //创建Worker，并给firstTask赋初值
            w = new Worker(firstTask);
            final Thread t = w.thread; //拿到属性thread
            if (t != null) {
                final ReentrantLock mainLock = this.mainLock;
                mainLock.lock(); //此处加锁：因为涉及属性：workers、largestPoolSize（可能） 更新
                try {
                    int rs = runStateOf(ctl.get()); //获取线程池最新状态

                    if (rs < SHUTDOWN || //如果当前状态是<SHUTDOWN也就是RUNNING状态
                        (rs == SHUTDOWN && firstTask == null)) { //或者状态是SHUTDOWN并且当前任务是空的（比如前面说的场景：阻塞队里里面还有，但当前已经是不允许提交的状态了）
                        if (t.isAlive()) //  检查Worker线程已经开始跑了。（thread.start()变为alive）
                            throw new IllegalThreadStateException(); 
                        workers.add(w);  //增加worker
                        int s = workers.size(); //获取最新worker的总数，比较并更新largestPoolSize
                        if (s > largestPoolSize)
                            largestPoolSize = s; 
                        workerAdded = true;  //表示添加worker成功   
                    }
                } finally {
                    mainLock.unlock();
                }
                if (workerAdded) {
                    //启动worker线程。该线程会一直循环执行getTask()，直至返回null，线程才结束
                    t.start(); //执行runWorker()
                    workerStarted = true; //表示线程已经跑起来了
                }
            }
        } finally {
            if (! workerStarted)
                addWorkerFailed(w);//worker线程没成功启动，进入失败处理逻辑
        }
        return workerStarted;//;返回当前worker是否启动成功。
    }

addWorker()总结：

检查线程池状态以确定能否提交任务
校验能否以核心线程的方式提交任务
线程池的状态是SHUTDOWN并且任务队列不是空，允许增加一个线程来帮助队列中的任务跑完，但不会提交任务
更新线程池线程数
超过线程池线程数峰值则更新峰值（largestPoolSize）
加锁（mainLock）来更新
启动worker线程

4.3 runWorker()方法

//执行任务
final void runWorker(Worker w) {
        Thread wt = Thread.currentThread(); //runWorker()是由Worker.run()调用，因此wt就是worker线程
        Runnable task = w.firstTask;  //拿到firstTask并赋值给局部变量task
        w.firstTask = null;  //firstTask置空
        w.unlock(); // 将state设置为0。因为构造函数设成-1，在执行任务前置为0。
        boolean completedAbruptly = true;//标识任务是不是立刻就完成了。
        try {
            //循环：先执行firstTask（不为空），后续通过getTask()获取任务。
            while (task != null || (task = getTask()) != null) {
                 //任务执行前加锁，任务完成后解锁。
                 //任何地方可通过判断锁状态来确认worker是否执行中
                w.lock();  //加锁。防止任务在执行过程中被中断。
                //判断目的：确保线程池当状态值大于等于 STOP 时有向线程发起过中断请求【调用了shutdownNow()】
                 // 两种情况:
                //1)如果当前线程池的状态是>=Stop的，并且当前线程没有被中断，那么就要执行中断。
                //2)或者当前线程目前是已中断的状态并且线程池的状态也是>=Stop的（注意Thread.interrupted是会擦除中断标识符的），那么因为中断标识符已经被擦除了，那么!wt.isInterrupted()一定返回true，这个时候还是要将当前线程中断。第二次执行runStateAtLeast(ctl.get(), STOP)相当于一个二次检查
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();//中断worker线程 。因为线程池将要终止了，所以这里没有从workerSet移除当前线程
                try {
                    beforeExecute(wt, task);//前置操作，空方法，可以业务自己实现
                    Throwable thrown = null;
                    try {
                        //执行任务：就是执行通过execute()提交的Runnable
                        task.run();//第一个是firstTask，后面的是通过getTask()拿到的任务
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);//后置操作,空方法,可以业务自己实现
                    }
                } finally {
                    task = null;//最后将task置为null，触发while循环的条件getTask()
                    w.completedTasks++; //已完成的任务计数器+1 
                    w.unlock();//释放当前线程的独占锁
                }
            }
            completedAbruptly = false;  //当第一个try的代码块有异常， completedAbruptly = false 不生效。最后completedAbruptly为true表示发生未知异常了
        } finally {
            //getTask返回null时，执行任务退出
            processWorkerExit(w, completedAbruptly);//completedAbruptly=true表示是突然退出的
        }
    }

runWorker()总结：

执行任务前先判断线程池是否是STOPING状态，是则中断worker线程。

执行任务：先执行firstTask，再从任务队列获取执行

如果没有任务，调用processWorkerExit()来执行线程退出的工作。

只要还有任务，worker线程就一直执行任务，并刷新completedTasks

4.4 getTask()方法

private Runnable getTask() {
        boolean timedOut = false;
        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);
            
            //1、先判断能否获取到任务
            
            // 1)如果线程池的状态是>=STOP状态,这个时候不再处理队列中的任务,并且减少worker记录数量,返回的任务为null,这个时候在runRWorker方法中会执行processWorkerExit进行worker的退出操作.
            // 2)如果线程池的状态是>=SHUTDOWN并且workQueue为空,就说明处于SHOTdown以上的状态下,且没有任务在等待,那么也属于获取不到任务,getTask返回null.

            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
                decrementWorkerCount();//扣减线程池线程数，在processWorkerExit()处理线程退出
                return null;
            }
            
            int wc = workerCountOf(c);//获取当前wokrer的数量

            //以下涉及空闲线程是否会被线程池销毁的处理逻辑

           // 线程超时处理前置条件：开启核心线程超时 或 线程池线程数大于核心线程数
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
            //线程超时处理的进一步判断：
            // 线程池线程数超过maximumPoolSize 或者 线程设置允许超时且当前worker取任务超时
            //并且 
            // 线程池大小不是零或阻塞队列是空的),这种就返回null,并减少线程池线程计数
        
            // 1、 (wc>maximumPoolSize)  && (wc>1)  一般情况，线程池线程数会少于配置的最大线程数，但在addWork中 状态=shutdown且队列不为空时，会创建一个Worker，此时可能导致wc>maximumPoolSize，这里同时限定wc>1。因此线程池减少1个线程也不影响任务的执行【processWorkerExit()会保证还有任务就至少留有1个worker线程】。
            // 2、 (wc>maximumPoolSize) && (workQueue.isEmpty()) 没有任务了，扣减更不影响
            // 3 、(timed && timedOut) && (wc > 1) 超时了，先扣减再说
            // 4 、(timed && timedOut) && (workQueue.isEmpty()) 超时了&队列没有任务，必须要扣减
            if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
                //这里为啥不用decrementWorkerCount()呢,上面使用decrementWorkerCount()是因为确定不管是什么情况下,数量都要减,多减一次也没事,因为这个时候就是要关闭线程池释放资源
                //这里不一样,线程池的状态可能是RUNNING状态,多减一次,可能导致获取不到worker去跑
                if (compareAndDecrementWorkerCount(c))
                    return null;  //扣减线程池线程数，在processWorkerExit()处理线程退出
                continue;//扣减失败， 跳出本次循环重新检查
            }
            //从队列中获取任务
            //符合【线程超时处理前置条件】时用poll设置超时时间，不符合就使用take（阻塞直至有返回）
            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r; //task不为空，此处返回task
                timedOut = true;  // 此处，r == null，肯定是poll操作超时了（注意，不代表队列空了），继续for循环，回到if ((wc > maximumPoolSize || (timed && timedOut)) 这个地方退出循环
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }
    
     private void decrementWorkerCount() {
        do {} while (! compareAndDecrementWorkerCount(ctl.get()));
    }

getTask()总结：

从workQueue中获取一个任务并返回

没有获取到任务就扣减线程池线程数。获取不到任务的四种情况：

线程池的状态是>=STOP

线程池的状态是SHUTDOWN并且任务队列为空

获取任务超时

线程池线程数大于maximumPoolSize并且队列为空

4.5 processWorkerExit()方法

//worker线程没有拿到任务，成为空闲线程。该方法对空闲线程进一步处理
private void processWorkerExit(Worker w, boolean completedAbruptly) {
    //如果completedAbruptly为true，则说明线程执行时出现异常，需要将workerCount数量减一
    //如果completedAbruptly为false，说明在getTask方法中已经对workerCount进行减一，这里不用再减
    if (completedAbruptly)
        decrementWorkerCount();

    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //更新已完成任务的数量的统计项
        completedTaskCount += w.completedTasks;
        //从worker集合中移除该worker
        workers.remove(w);
    } finally {
        mainLock.unlock();
    }
    //尝试关闭线程池,但如果是正常运行状态,就不会关闭
    tryTerminate();

    int c = ctl.get();
    
    if (runStateLessThan(c, STOP)) {//1、线程池是SHUTDOWN或RUNNING（如果不是这两个状态,说明线程已经停止了，不做任何操作）
        if (!completedAbruptly) {//2、线程正常结束
           // 如果没有开启核心线程超时配置，则至少保留corePoolSize个线程；
            int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
            if (min == 0 && !workQueue.isEmpty())//如果允许核心线程超时并且当前队列里面还有任务没跑，必须留1个线程,不能全死掉.
                min = 1;
            // 如果线程池数量>=最少预留线程数
            if (workerCountOf(c) >= min)
                return; // 线程自然结束了，不用补充worker
        }
        // 1、执行任务异常结束的，补充worker
        // 2、如果线程池数量<最少预留线程数，补充worker
        addWorker(null, false);//异常结束 增加worker
        //注: 别问我为啥上面要删除worker,还要再加,不删是不是不用加了. 明确下那个任务已经退出getTask那块的死循环了,永远回不去了,只能新增worker.
    }
}

processWorkerExit()方法总结！！！！！：

当Worker线程结束前，完成以下工作：扣减线程池线程数（ctl）、更新已完成任务数（completedTaskCount）、Worker集合中移除一个Worker（workers）、尝试终止线程池、计算线程池的最少保留线程数、根据最少保留线程数来确定是否补充一个Worker。

关于最少保留线程数：如果没有开启核心线程超时配置，则至少保留corePoolSize个线程；如果开启核心线程超时并且当前队列里面还有任务，只需保留1个线程；

需要补充worker的两种情况：1、线程池线程数<最少保留线程数 2、任务执行异常结束

4.6 tryTerminate()方法

//尝试终止线程池
final void tryTerminate() {
        for (;;) {  //cas自旋 确保更新成功
            int c = ctl.get();
            //RUNNING状态,不能终止线程池
            //线程池状态是TIDYING或TERMINATED说明线程池已经处于正在终止的路上,不用再终止了.
            //状态为SHUTDOWN，但是任务队列不为空,也不能终止线程池
            if (isRunning(c) ||
                runStateAtLeast(c, TIDYING) ||
                (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
                return;
                
                //调用shutdown()或者shutdownNow()方法时，执行以下处理
                
                //工作线程数量不等于0，中断一个空闲的工作线程并返回
                //这个时候线程池一定是 1、STOP的状态或者 2、SHUTDOW且队列为空  这两种情况中断一个空闲worker
            if (workerCountOf(c) != 0) { 
                interruptIdleWorkers(ONLY_ONE);
                return;
            }

            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // 设置线程池状态为TIDYING，如果设置成功，则调用terminated()
                if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                    try {
                        terminated(); //钩子方法，子类实现。默认什么都不做
                    } finally {
                    // 设置状态为TERMINATED
                        ctl.set(ctlOf(TERMINATED, 0));
                        termination.signalAll(); //唤醒阻塞等待的线程 （future的场景）
                    }
                    return;
                }
            } finally {
                mainLock.unlock();
            }
            // else retry on failed CAS
        }
    }

tryTerminate()总结

尝试终止线程池

不能终止线程池：

状态是RUNNING，不能直接终止（如果是调用shutdown()，shutdownNow()，会先将状态改为SHUTDOWN）

状态是TIDYING或者TERMINATED，不能终止（因为已经处于终止过程中）

状态是SHUTDOWN并且任务队列不为空，不能终止（因为还有任务要处理）

可以终止线程池：

状态是SHUTDOWN并且任务队列为空

状态是STOP

符合可以终止线程池的条件下，如果线程池线程数不等于0，那就中断1个Worker线程，不修改线程池状态

符合可以终止线程池的条件下，并且线程池线程数等于0，那就将线程池状态改为TIDYING，执行完钩子方法terminated()后状态再改为TERMINATED

interruptIdleWorkers(ONLY_ONE); 是否好奇为啥这里只中断一个worker呢, 这里就涉及到了线程池的优雅退出了.
当执行到 interruptIdleWorkers(ONLY_ONE) 前面的时候, 线程池只能处于两种状态:
1) STOP 状态 , 这个时候 workQueue 可能是有值的 , workQueue 在清空的过程中了.
2) SHUTDOWN 状态并且 workQueue 是空的 .
这两种状态都是说明, 线程池即将关闭, 或者说空闲的线程此时已经没用了,这个时候随手关一个, 反正要关,早关晚关而已.

4.7 interruptIdleWorker()方法

//中断一个或多个线程
private void interruptIdleWorkers(boolean onlyOne) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //遍历worker，根据onlyOne判断，如果为ture只中断一个线程
        for (Worker w : workers) {
            Thread t = w.thread;
            //线程没有被中断并且线程是空闲状态
            //通过tryLock实现：不能中断还没有开始执行或者还在执行中的worker线程。
            //线程未启动：-1 ，线程正在执行：1  ，trylock：0->1 ; 
            
            if (!t.isInterrupted() && w.tryLock()) { 
                try {
                    t.interrupt(); //中断操作，之后该线程就结束了
                } catch (SecurityException ignore) {
                } finally {
                    w.unlock();
                }
            }
            if (onlyOne)
                break;
        }
    } finally {
        mainLock.unlock();
    }
}

interruptIdleWorker()总结：

从worker集合中遍历并中断worker线程

只有worker线程状态是0的，才能够中断（不能中断未启动或者还在执行中的Worker线程）

4.8 shutdown()方法

//初始化一个有序的关闭，之前提交的任务都会被执行，但是新提交的任务则不会被允许放入任务队列中。如果之前被调用过了的话，那么再次调用也没什么用
public void shutdown() {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock(); //mainLock是全局变量，加锁确保不会并发关闭线程池
        try {
            checkShutdownAccess();//安全策略判断。方法检查每一个线程池的线程是否有可以ShutDown的权限。
            advanceRunState(SHUTDOWN); //CAS自旋把ctl中的状态从RUNNING变为SHUTDOWN
            interruptIdleWorkers();//中断所有空闲线程
            onShutdown(); // 方法告知子类，线程池要处于ShutDown状态了 ，ScheduledThreadPoolExecutor预留的钩子
        } finally {
            mainLock.unlock();
        }
        tryTerminate();//尝试终止线程池
    }

shutdown()方法总结

执行shutdown()方法：关闭线程池，不再接受新的任务，已提交执行的任务继续执行。

调用interruptIdleWorkers()先中断所有空闲线程

调用tryTerminate()尝试终止线程池

shutdown()将线程池状态改为SHUTDOWN但不是STOP

4.9 shutdownNow()方法

//关闭线程池，不再接受新的任务，正在执行的任务尝试终止
public List<Runnable> shutdownNow() {
        List<Runnable> tasks;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            checkShutdownAccess();
            advanceRunState(STOP);//线程池的状态置为STOP
            interruptWorkers();
            tasks = drainQueue(); //将剩余任务返回
        } finally {
            mainLock.unlock();
        }
        tryTerminate();
        return tasks;
    }
    private void interruptWorkers() {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            for (Worker w : workers) //循环所有的worker
                w.interruptIfStarted();//已经启动的线程直接执行中断
        } finally {
            mainLock.unlock();
        }
    }
     void interruptIfStarted() {
            Thread t;
            //只有刚刚构建的worker的时候,状态state值是-1(这里也能体现刚构建的worker无法被中断),其他情况都是>=0的
            if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                }
            }
        }

ShutDownNow()方法总结

关闭线程池，不再接受新的任务，中断已经启动的Worker线程

将线程池状态改为STOP

返回未完成的任务队列

4.10 isShutdown()方法

确认线程池是否关闭。判断状态是不是RUNNING.

public boolean isShutdown() {
        return ! isRunning(ctl.get());
    }

4.11 prestartCoreThread()方法

public boolean prestartCoreThread() {
        return workerCountOf(ctl.get()) < corePoolSize &&
            addWorker(null, true);
    }

启动一个空闲的线程作为核心线程
如果核心线程数已到阈值, 会加入失败, 返回false, 如果线程池处于SHUTDOWN以上的状态也返回false
只有真正这个线程调用start方法跑起来, 才会返回true

4.12 prestartAllCoreThreads()方法

启动所有核心线程，使他们等待获取任务

public int prestartAllCoreThreads() {
        int n = 0;
        while (addWorker(null, true))//null代表空闲线程,true代表是增加的是核心线程
            ++n;//死循环增加空闲 worker 而已
        return n;
    }

posted @ 2022-09-03 17:01 拿了桔子跑-范德依彪阅读(928) 评论(0) 收藏举报

刷新页面返回顶部

拿了桔子跑-范德彪