线程池原理

1. 为什么要使用线程池

线程是很占用系统资源的,对线程管理不善很容易导致系统问题。因此,我们最好使用线程池来管理线程,使用线程池主要有如下好处:

  • 降低资源消耗。通过复用线程可以降低线程关闭的次数,从而尽可能降低系统性能损耗;
  • 提升系统响应速度。通过复用线程,省去创建线程的过程,从而提升系统的响应速度;
  • 提高线程可管理性。线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,因此,需要使用线程池来管理线程。

2. 线程池的工作原理

当一个并发任务提交给线程池,线程池分配线程去执行任务的过程如图所示:

 

可以看出,线程池执行所提交的任务过程主要有以下阶段:

  1. 判断当前线程数是否大于了核心线程数。如果不是,即使有空闲的线程,也会创建一个新线程执行刚提交的任务,否则,说明核心线程池中所有的线程都在执行任务,进入第2步;
  2. 判断当前阻塞队列是否已满,如果未满,则将任务放进阻塞队列中;否则,则进入第3步;
  3. 判断当前的线程数是都大于了最大线程数,如果没有,则创建一个新的线程来执行任务,否则,根据设置的拒绝策略拒绝任务。

3. 线程池的创建

创建线程池主要是ThreadPoolExecutor类来完成,(在阿里巴巴开发规范中,不建议使用Executors.new....ThreadPool'的方法来创建线程池,因为java提供的线程池各自有各自的优缺点,可能并不适合你自己的业务场景,所以最好自己通过ThreadPoolExecutor配置参数)。ThreadPoolExecutor有许多重载的构造方法,ThreadPoolExecutor的构造方法为:

ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler)

下面对参数进行说明:

corePoolSize:核心线程数。当提交一个任务时,如果当前线程池中的线程数没有达到corePoolSize,则会创建新的线程来执行所提交的任务,即使当前线程池有空闲的线程。如果当前线程个数已经达到了corePoolSize,则不再重新创建线程。如果调用了prestartCoreThread()或者 prestartAllCoreThreads(),线程池创建的时候所有的核心线程都会被创建并且启动。

maximumPoolSize:最大线程个数。如果当阻塞队列已满时,并且当前线程池线程数没有超过maximumPoolSize的话,就会创建新的线程来执行任务。

keepAliveTime:空闲线程存活时间。如果当前线程池的线程数超过了corePoolSize,并且线程空闲时间超过了keepAliveTime的话,就会将这些空闲线程销毁,这样可以尽可能降低系统资源消耗。

unit:时间单位。为keepAliveTime指定时间单位。

workQueue:阻塞队列。保存任务的阻塞队列,关于阻塞队列可以看这篇文章

threadFactory:线程工厂。可以通过指定线程工厂为每个创建出来的线程设置名字,如果出现并发问题,也方便定位问题。

handler:拒绝策略。当线程池的阻塞队列已满和线程数达到了最大线程数,说明当前线程池已经处于饱和状态了,那么就需要采用一种策略来处理这种情况。采用的策略有这几种:

  • AbortPolicy: 直接拒绝所提交的任务,抛出RejectedExecutionException异常;
  • CallerRunsPolicy:用调用者所在的线程来执行任务;
  • DiscardPolicy:不处理直接丢弃掉任务;
  • DiscardOldestPolicy:丢弃掉阻塞队列中存放时间最久的任务,执行当前任务。

4.线程池执行逻辑

通过ThreadPoolExecutor创建线程池后,提交任务后执行过程是怎样的,下面通过源码来看一下。execute方法源码如下:

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    /*
     * Proceed in 3 steps:
     *
     * 1. If fewer than corePoolSize threads are running, try to
     * start a new thread with the given command as its first
     * task.  The call to addWorker atomically checks runState and
     * workerCount, and so prevents false alarms that would add
     * threads when it shouldn't, by returning false.
     *
     * 2. If a task can be successfully queued, then we still need
     * to double-check whether we should have added a thread
     * (because existing ones died since last checking) or that
     * the pool shut down since entry into this method. So we
     * recheck state and if necessary roll back the enqueuing if
     * stopped, or start a new thread if there are none.
     *
     * 3. If we cannot queue task, then we try to add a new
     * thread.  If it fails, we know we are shut down or saturated
     * and so reject the task.
     */
    int c = ctl.get();
    //如果线程池的线程个数少于corePoolSize则创建新线程执行当前任务
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    //如果线程个数大于corePoolSize或者创建线程失败,则将任务存放在阻塞队列workQueue中
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        if (! isRunning(recheck) && remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    //如果当前任务无法放进阻塞队列中,则创建新的线程来执行任务
    else if (!addWorker(command, false))
        reject(command);
}

execute方法执行逻辑有这样几种情况(与上文提到的过程基本一致,这里再说一下):

  1. 如果当前线程数少于corePoolSize,则会创建新的线程来执行新的任务;
  2. 如果当前线程数等于或者大于corePoolSize,则会将任务存放到阻塞队列中;
  3. 如果阻塞队列已满,则会创建新的线程来执行任务;
  4. 如果当前线程数超过了maximumPoolSize,则会使拒绝策略来拒绝任务。

5. 线程池的关闭

可以通过shutdown和shutdownNow这两个方法来关闭线程池。他们都是遍历线程池中所有的线程,然后依次中断线程。

shutdown和shutdownNow的区别是:

  • shutdownNow首先将线程池的状态设置为STOP,然后尝试停止所有的正在执行和未执行任务的线程,并返回等待执行任务的列表;
  • shutdown是将线程池的状态设置为SHUTDOWN状态,然后中断所有没有正在执行任务的线程

可以看出shutdown方法会将正在执行的任务继续执行完,而shutdownNow会直接中断正在执行的任务。当我们调用了其中任意一个方法,isShutdown方法都会返回true,但是只有当所有的线程都关闭成功,才表示线程池成功关闭,这时调用isTerminated方法才会返回true。

6. 如何合理配置线程池参数

要想合理的配置线程池参数,就必须先分析任务特性,可以从以下几个角度来分析:

  • 任务的性质:CPU密集型任务,IO密集型任务和混合型任务。
  • 任务的优先级:高,中和低。
  • 任务的执行时间:长,中和短。
  • 任务的依赖性:是否依赖其他系统资源,如数据库连接。

1.任务性质不同的任务可以用不同规模的线程池分开处理。对于CPU密集型任务,配置尽可能少的线程数量,一般配置Ncpu+1个线程大小的线程池。对于IO密集型任务,由于需要等待IO操作,线程并不是一直在执行任务,则配置尽可能多的线程,如2xNcpu对于混合型的任务,如果可以拆分,则将其拆分成一个CPU密集型任务和IO密集型任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐率要高于串行执行的吞吐率,如果这两个任务执行时间相差太大,则没必要进行分解。我们可以通过Runtime.getRuntime().availableProcessors()方法获得当前设备的CPU个数

2.优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。它可以让优先级高的任务先得到执行,需要注意的是如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。

3.执行时间不同的任务可以交给不同规模的线程池来处理,或者也可以使用优先级队列,让执行时间短的任务先执行

4.依赖数据库连接池的任务,因为线程提交SQL后需要等待数据库返回结果,如果等待的时间越长CPU空闲时间就越长,那么线程数应该设置越大,这样才能更好的利用CPU。

 

并且,阻塞队列最好是使用有界队列,如果采用无界队列的话,一旦任务积压在阻塞队列中的话就会占用过多的内存资源,甚至会使得系统崩溃。

 

最后,推荐一本书籍《Java并发编程的艺术》

 

posted @ 2020-08-06 21:19  橘子洲头。  阅读(344)  评论(0编辑  收藏  举报