线程池的简介及底层原理

一、什么是线程池？

线程池做的工作主要是控制运行的线程的数量，处理过程中将任务加入队列，然后在线程创建后启动这些任务，如果线程数超过了最大数量，超出的数量的线程排队等候，等其他线程执行完毕，再从队列中取出任务来执行。

线程池的主要特点为：线程复用、控制最大并发数、管理线程。

二、线程池的优势

降低资源消耗。通过重复利用自己创建的线程，降低线程创建和销毁造成的消耗。
提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。
提高线程的可管理性。线程是稀缺资源，如果无限的创建，不仅会消耗资源，还会较低系统的稳定性，使用线程池可以进行统一分配，调优和监控。

三、架构实现

Java 中的线程池是通过 Executor 框架实现的，该框架中用到了Executor，Executors，ExecutorService，ThreadPoolExecutor 这几个类。

四、线程池的几种创建方式

4.0 ThreadPoolExecutor()

最原始的线程池创建，下面的前三种创建方式都是对 ThreadPoolExecutor 的封装。

4.1 Executors.newFixedThreadPool(int)

主要特点如下：
1. 创建一个定长线程池，可控制线程的最大并发数，超出的线程会在队列中等待.
2. newFixedThreadPool 创建的线程池 corePoolSize 和 MaxmumPoolSize 是相等的，它使用的的LinkedBlockingQueue。

4.2 Executors.newSingleThreadExecutor()

主要特点如下：
1. 创建一个单线程化的线程池，它只会用唯一的工作线程来执行任务，保证所有任务都按照指定顺序执行。
2. newSingleThreadExecutor 将 corePoolSize 和 MaxmumPoolSize 都设置为 1，它使用的是LinkedBlockingQueue。

4.3 Executors.newCachedThreadPool()

主要特点如下：
1. 创建一个可缓存线程池，如果线程池长度超过处理需要，可灵活回收空闲线程；若无可回收，则创建新线程。
2. newCachedThreadPool 将 corePoolSize 设置为 0，MaxmumPoolSize 设置为 Integer.MAX_VALUE，它使用的是 SynchronousQueue，也就是说来了任务就创建线程运行，如果线程空闲超过60秒，就销毁线程。

4.4 Executors.newWorkStealingPool()

Java 8 加入的创建方法，其内部会构建ForkJoinPool，利用Work-Stealing算法，并行地处理任务，不保证处理顺序。

4.5 生产中的使用

实际生产中不使用 Executors 创建线程池，需要使用 ThreadPoolExecutor 自定义创建。

阿里巴巴开发手册中关于并发处理的部分内容：

自定义创建线程池：

  1 public static void main(String[] args) {
  2     ExecutorService threadPool = new ThreadPoolExecutor(
  3             2,
  4             5,
  5             1L,
  6             TimeUnit.SECONDS,
  7             new LinkedBlockingQueue<>(3),
  8             Executors.defaultThreadFactory(),
  9             new ThreadPoolExecutor.AbortPolicy());
 10 
 11     try {
 12         for (int i = 1; i <= 10; i++) {
 13             threadPool.execute(() -> {
 14                 System.out.println(Thread.currentThread().getName() + "\t 办理业务");
 15             });
 16         }
 17     } finally {
 18         threadPool.shutdown();
 19     }
 20 }

五、线程池中的几个重要参数

corePoolSize：线程池中的常驻核心线程数。
maximumPoolSize：线程池能够容纳的同时执行的最大线程数，此值大于等于 1。
keepAliveTime：多余的空闲线程存活时间，当空闲时间达到 keepAliveTime 值时，多余的线程会被销毁，直到只剩下 corePoolSize 个线程为止。
unit：keepAliveTime 的单位。
workQueue：任务队列，被提交但尚未被执行的任务。
threadFactory：表示生成线程池中工作线程的线程工厂，用户创建新线程，一般用默认即可。
handler：拒绝策略，表示当线程队列满了并且工作线程大于等于线程池的最大线程数(maxnumPoolSize)时如何来拒绝。

六、线程池的底层工作原理

1. 在创建了线程池后，等待提交过来的任务请求。
2. 当调用 execute() 方法添加一个请求任务时，线程池会做如下判断：
     2.1 如果正在运行的线程数量小于 corePoolSize，那么马上创建线程运行这个任务；
     2.2 如果正在运行的线程数量大于或等于 corePoolSize，那么将这个任务放入队列；
     2.3 如果这时候队列满了且正在运行的线程数量还小于 maximumPoolSize，那么还是要创建非核心线程立刻运行这个任务；
     2.4 如果队列满了且正在运行的线程数量大于或等于 maximumPoolSize，那么线程池会启动饱和拒绝策略来执行。
3. 当一个线程完成任务时，它会从队列中取下一个任务来执行。
4. 当一个线程无事可做，超过一定的时间(keepAliveTime) 时，线程池会判断：
     如果当前运行的线程数大于 corePoolSize，那么这个线程就被停掉。
    所以线程池的所有任务完成后，它最终会收缩到 corePoolSize 的大小。

七、线程池的拒绝策略

当线程池中工作线程数达到 maximumPoolSize，且工作队列已满，那么就会执行拒绝策略处理任务，jdk 内置有四种拒绝策略。

拒绝策略	拒绝行为
AbortPolicy	直接抛出 RejectedException 异常阻止系统正常运行
CallerRunsPolicy	"调用者运行"一种调节机制，该策略既不会抛弃任务，也不会抛出异常，而是由提交任务者执行这个任务
DiscardOldestPolicy	抛弃队列中等待最久的任务，然后把当前任务加入队列中尝试再次提交
DiscardPolicy	直接丢弃任务，不予任何处理也不抛出异常。如果允许任务丢失，这是最好的拒绝策略

八、合理配置线程池参数

首先，通过 System.out.println(Runtime.getRuntime().availableProcessors()); 获得当前计算机的 CPU 核数。

8.1 CPU 密集型

       CPU 密集的意思是该任务需要大量的运算，而没有阻塞，CPU一直全速运行。
        CPU 密集任务只有在真正的多核 CPU 上才可能得到加速(通过多线程)，而在单核CPU上，无论开几个模拟的多线程，该任务都不可能得到加速，因为CPU总的运算能力就那些。
        CPU 密集型任务配置尽可能少的线程数量：
        一般公式：CPU核数+1个线程的线程池

8.2 IO密集型

由于 IO 密集型任务线程并不是一直在执行任务，则应配置尽可能多的线程，如 CPU 核数 * 2。
IO密集型，即该任务需要大量的IO，即大量的阻塞。在单线程上运行 IO 密集型的任务会导致浪费大量的 CPU 运算能力在等待上。所以在 IO 密集型任务中使用多线程可以大大的加速程序运行，即使在单核CPU上，这种加速主要就是利用了被浪费掉的阻塞时间。
IO 密集型时，大部分线程都阻塞，故需要多配置线程数：
参考公式：CPU核数 / (1-阻塞系数) 阻塞系数在0.8~0.9之间
比如 8 核CPU：8 / (1 - 0.9) = 80 个线程数

posted @ 2019-12-18 17:00 辰凩風阅读(2918) 评论(0) 编辑收藏举报

刷新页面返回顶部

辰凩風