线程池的简介及底层原理
一、什么是线程池?
线程池做的工作主要是控制运行的线程的数量,处理过程中将任务加入队列,然后在线程创建后启动这些任务,如果线程数超过了最大数量,超出的数量的线程排队等候,等其他线程执行完毕,再从队列中取出任务来执行。
线程池的主要特点为:线程复用、控制最大并发数、管理线程。
二、线程池的优势
- 降低资源消耗。通过重复利用自己创建的线程,降低线程创建和销毁造成的消耗。
- 提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行。
- 提高线程的可管理性。线程是稀缺资源,如果无限的创建,不仅会消耗资源,还会较低系统的稳定性,使用线程池可以进行统一分配,调优和监控。
三、架构实现
Java 中的线程池是通过 Executor 框架实现的,该框架中用到了Executor,Executors,ExecutorService,ThreadPoolExecutor 这几个类。
四、线程池的几种创建方式
4.0 ThreadPoolExecutor()
最原始的线程池创建,下面的前三种创建方式都是对 ThreadPoolExecutor 的封装。
4.1 Executors.newFixedThreadPool(int)
主要特点如下:
1. 创建一个定长线程池,可控制线程的最大并发数,超出的线程会在队列中等待.
2. newFixedThreadPool 创建的线程池 corePoolSize 和 MaxmumPoolSize 是相等的,它使用的的LinkedBlockingQueue。
4.2 Executors.newSingleThreadExecutor()
主要特点如下:
1. 创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务都按照指定顺序执行。
2. newSingleThreadExecutor 将 corePoolSize 和 MaxmumPoolSize 都设置为 1,它使用的是LinkedBlockingQueue。
4.3 Executors.newCachedThreadPool()
主要特点如下:
1. 创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程;若无可回收,则创建新线程。
2. newCachedThreadPool 将 corePoolSize 设置为 0,MaxmumPoolSize 设置为 Integer.MAX_VALUE,它使用的是 SynchronousQueue,也就是说来了任务就创建线程运行,如果线程空闲超过60秒,就销毁线程。
4.4 Executors.newWorkStealingPool()
Java 8 加入的创建方法,其内部会构建ForkJoinPool,利用Work-Stealing算法,并行地处理任务,不保证处理顺序。
4.5 生产中的使用
实际生产中不使用 Executors 创建线程池,需要使用 ThreadPoolExecutor 自定义创建。
阿里巴巴开发手册中关于并发处理的部分内容:
自定义创建线程池:
1 public static void main(String[] args) { 2 ExecutorService threadPool = new ThreadPoolExecutor( 3 2, 4 5, 5 1L, 6 TimeUnit.SECONDS, 7 new LinkedBlockingQueue<>(3), 8 Executors.defaultThreadFactory(), 9 new ThreadPoolExecutor.AbortPolicy()); 10 11 try { 12 for (int i = 1; i <= 10; i++) { 13 threadPool.execute(() -> { 14 System.out.println(Thread.currentThread().getName() + "\t 办理业务"); 15 }); 16 } 17 } finally { 18 threadPool.shutdown(); 19 } 20 }
五、线程池中的几个重要参数
- corePoolSize:线程池中的常驻核心线程数。
- maximumPoolSize:线程池能够容纳的同时执行的最大线程数,此值大于等于 1。
- keepAliveTime:多余的空闲线程存活时间,当空闲时间达到 keepAliveTime 值时,多余的线程会被销毁,直到只剩下 corePoolSize 个线程为止。
- unit:keepAliveTime 的单位。
- workQueue:任务队列,被提交但尚未被执行的任务。
- threadFactory:表示生成线程池中工作线程的线程工厂,用户创建新线程,一般用默认即可。
- handler:拒绝策略,表示当线程队列满了并且工作线程大于等于线程池的最大线程数(maxnumPoolSize)时如何来拒绝。
六、线程池的底层工作原理
1. 在创建了线程池后,等待提交过来的任务请求。
2. 当调用 execute() 方法添加一个请求任务时,线程池会做如下判断:
2.1 如果正在运行的线程数量小于 corePoolSize,那么马上创建线程运行这个任务;
2.2 如果正在运行的线程数量大于或等于 corePoolSize,那么将这个任务放入队列;
2.3 如果这时候队列满了且正在运行的线程数量还小于 maximumPoolSize,那么还是要创建非核心线程立刻运行这个任务;
2.4 如果队列满了且正在运行的线程数量大于或等于 maximumPoolSize,那么线程池会启动饱和拒绝策略来执行。
3. 当一个线程完成任务时,它会从队列中取下一个任务来执行。
4. 当一个线程无事可做,超过一定的时间(keepAliveTime) 时,线程池会判断:
如果当前运行的线程数大于 corePoolSize,那么这个线程就被停掉。
所以线程池的所有任务完成后,它最终会收缩到 corePoolSize 的大小。
七、线程池的拒绝策略
当线程池中工作线程数达到 maximumPoolSize,且工作队列已满,那么就会执行拒绝策略处理任务,jdk 内置有四种拒绝策略。
拒绝策略 | 拒绝行为 |
AbortPolicy |
直接抛出 RejectedException 异常阻止系统正常运行 |
CallerRunsPolicy |
"调用者运行"一种调节机制,该策略既不会抛弃任务,也不会抛出异常,而是由提交任务者执行这个任务 |
DiscardOldestPolicy |
抛弃队列中等待最久的任务,然后把当前任务加入队列中尝试再次提交 |
DiscardPolicy |
直接丢弃任务,不予任何处理也不抛出异常。如果允许任务丢失,这是最好的拒绝策略 |
八、合理配置线程池参数
首先,通过 System.out.println(Runtime.getRuntime().availableProcessors()); 获得当前计算机的 CPU 核数。
8.1 CPU 密集型
CPU 密集的意思是该任务需要大量的运算,而没有阻塞,CPU一直全速运行。
CPU 密集任务只有在真正的多核 CPU 上才可能得到加速(通过多线程),而在单核CPU上,无论开几个模拟的多线程,该任务都不可能得到加速,因为CPU总的运算能力就那些。
CPU 密集型任务配置尽可能少的线程数量:
一般公式:CPU核数+1个线程的线程池
8.2 IO密集型
- 由于 IO 密集型任务线程并不是一直在执行任务,则应配置尽可能多的线程,如 CPU 核数 * 2。
- IO密集型,即该任务需要大量的IO,即大量的阻塞。在单线程上运行 IO 密集型的任务会导致浪费大量的 CPU 运算能力在等待上。所以在 IO 密集型任务中使用多线程可以大大的加速程序运行,即使在单核CPU上,这种加速主要就是利用了被浪费掉的阻塞时间。
IO 密集型时,大部分线程都阻塞,故需要多配置线程数:
参考公式:CPU核数 / (1-阻塞系数) 阻塞系数在0.8~0.9之间
比如 8 核CPU:8 / (1 - 0.9) = 80 个线程数