CompletionService和ExecutorCompletionService详解
本文主要讲解线程池的完成服务:
CompletionService接口定义了一组任务管理接口:
1.submit() - 提交任务;
2.take() - 获取任务结果;
3.poll() - 获取任务结果
ExecutorCompletionService类是CompletionService接口的实现:
1.ExecutorCompletionService内部管理者一个已完成任务的阻塞队列;
2.ExecutorCompletionService引用了一个Executor, 用来执行任务;
3.submit()方法最终会委托给内部的executor去执行任务;
4.take/poll方法的工作都委托给内部的已完成任务阻塞队列;
5.如果阻塞队列中有已完成的任务, take方法就返回任务的结果, 否则阻塞等待任务完成;
6.poll与take方法不同, poll有两个版本:
1)无参的poll方法 --- 如果完成队列中有数据就返回, 否则返回null;
2)有参数的poll方法 --- 如果完成队列中有数据就直接返回, 否则等待指定的时间, 到时间后如果还是没有数据就返回null;
3)ExecutorCompletionService主要用与管理异步任务 (有结果的任务, 任务完成后要处理结果)
关于CompletionService和ExecutorCompletionService的类图如下:
接下来我们用代码一步步的讲解为什么要有完成服务(我做了以下三种测试,并分析了利弊):
package com.idea.test;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import java.util.concurrent.*;
public class Test2 {
public static void main(String[] args) throws ExecutionException, InterruptedException {
case3();
}
/**
* <一>
* 1. 用List收集任务结果 (List记录每个submit返回的Future)
* 2. 循环查看结果, Future不一定完成, 如果没有完成, 那么调用get会租塞
* 3. 如果排在前面的任务没有完成, 那么就会阻塞, 这样后面已经完成的任务就没法获得结果了, 导致了不必要的等待时间.
* 更为严重的是: 第一个任务如果几个小时或永远完成不了, 而后面的任务几秒钟就完成了, 那么后面的任务的结果都将得不到处理
*
* 导致: 已完成的任务可能得不到及时处理
*/
private static void case1() throws ExecutionException, InterruptedException {
final Random random=new Random();
ExecutorService service=Executors.newFixedThreadPool(10);
List<Future<String>> taskResultHolder=new ArrayList<>();
for(int i=0;i<50;i++){
//搜集任务结果
taskResultHolder.add(service.submit(new Callable<String>(){
@Override
public String call() throws Exception {
Thread.sleep(random.nextInt(5000));
return Thread.currentThread().getName();
}
})
);
}
//处理任务结果
int count=0;
long startTime = System.currentTimeMillis();
System.out.println("handler result begin");
for(Future<String> future:taskResultHolder){
System.out.println(future.get());
count++;
}
System.out.println("handler result end");
System.out.println(count + "task done!");
long endTime = System.currentTimeMillis();
float seconds = (endTime - startTime) / 1000F;
System.out.println("共耗时:"+Float.toString(seconds) + " seconds.");
//关闭线程池
service.shutdown();
}
/**
* <二> 只对第一种情况进行的改进
* 1. 查看任务是否完成, 如果完成, 就获取任务的结果, 让后重任务列表中删除任务.
* 2. 如果任务未完成, 就跳过此任务, 继续查看下一个任务结果.
* 3. 如果到了任务列表末端, 那么就从新回到任务列表开始, 然后继续从第一步开始执行
*
* 这样就可以及时处理已完成任务的结果了
*/
private static void case2() throws ExecutionException, InterruptedException {
final Random random=new Random();
ExecutorService service=Executors.newFixedThreadPool(10);
List<Future<String>> results=new ArrayList();
for(int i=0;i<50;i++){
Callable<String> task=new Callable<String>(){
@Override
public String call() throws Exception {
Thread.sleep(random.nextInt(5000)); //模拟耗时操作
return Thread.currentThread().getName();
}
};
Future<String> future=service.submit(task);
results.add(future);// 搜集任务结果
}
int count=0;
//自旋, 获取结果
long startTime = System.currentTimeMillis();
System.out.println("hanlder result begin");
for(int i=0;i<results.size();i++){
Future<String> taskHolder=results.get(i);
if(taskHolder.isDone()){//任务完成
String result=taskHolder.get(); //获取结果, 进行某些操作
System.out.println("result: " + result);
results.remove(taskHolder);
i--;
count++;//完成的任务的计数器
}
//回到列表开头, 从新获取结果
if(i==results.size()-1){
i=-1;
}
}
System.out.println("handler result end");
System.out.println(count+"task done");
long endTime = System.currentTimeMillis();
float seconds = (endTime - startTime) / 1000F;
System.out.println("共耗时:"+Float.toString(seconds) + " seconds.");
service.shutdown();
}
/**
* <三> 使用ExecutorCompletionService管理异步任务
* 1. Java中的ExecutorCompletionService<V>本身有管理任务队列的功能
* i. ExecutorCompletionService内部维护列一个队列, 用于管理已完成的任务
* ii. 内部还维护列一个Executor, 可以执行任务
*
* 2. ExecutorCompletionService内部维护了一个BlockingQueue, 只有完成的任务才被加入到队列中
*
* 3. 任务一完成就加入到内置管理队列中, 如果队列中的数据为空时, 调用take()就会阻塞 (等待任务完成)
* i. 关于完成任务是如何加入到完成队列中的, 请参考ExecutorCompletionService的内部类QueueingFuture的done()方法
*
* 4. ExecutorCompletionService的take/poll方法是对BlockingQueue对应的方法的封装, 关于BlockingQueue的take/poll方法:
* i. take()方法, 如果队列中有数据, 就返回数据, 否则就一直阻塞;
* ii. poll()方法: 如果有值就返回, 否则返回null
* iii. poll(long timeout, TimeUnit unit)方法: 如果有值就返回, 否则等待指定的时间; 如果时间到了如果有值, 就返回值, 否则返回null
*
* 解决了已完成任务得不到及时处理的问题
*/
private static void case3() throws InterruptedException, ExecutionException {
final Random random=new Random();
ExecutorService service=Executors.newFixedThreadPool(10);
ExecutorCompletionService<String> completionService=new ExecutorCompletionService<String>(service);
for(int i=0;i<50;i++){
completionService.submit(new Callable<String>(){
@Override
public String call() throws Exception {
Thread.sleep(random.nextInt(5000));
return Thread.currentThread().getName();
}
}) ;
}
int completionTask=0;
long startTime = System.currentTimeMillis();
while(completionTask<50){
//如果完成队列中没有数据, 则阻塞; 否则返回队列中的数据
Future<String> future=completionService.take();
System.out.println("result:"+future.get());
completionTask++;
}
System.out.println(completionTask + " task done !");
long endTime = System.currentTimeMillis();
float seconds = (endTime - startTime) / 1000F;
System.out.println("共耗时:"+Float.toString(seconds) + " seconds.");
//ExecutorService使用完一定要关闭 (回收资源, 否则系统资源耗尽! .... 呵呵...)
service.shutdown();
}
}
那么, ExecutorCompletionService是如何执行任务, 又是如何将任务的结果存储到完成队列中的呢?
1.ExecutorCompletionService在submit任务时, 会创建一个QueueingFuture, 然后将创建的QueueingFuture丢给executor, 让executor完成任务的执行工作。
2.QueueingFuture继承与FutureTask类, 而FutureTask实现了两个接口Runnable和Future。
public void run() {
if (state != NEW ||
!UNSAFE.compareAndSwapObject(this, runnerOffset,
null, Thread.currentThread()))
return;
try {
Callable<V> c = callable;
if (c != null && state == NEW) {
V result;
boolean ran;
try {
result = c.call();
ran = true;
} catch (Throwable ex) {
result = null;
ran = false;
setException(ex);
}
if (ran)
set(result);
}
} finally {
// runner must be non-null until state is settled to
// prevent concurrent calls to run()
runner = null;
// state must be re-read after nulling runner to prevent
// leaked interrupts
int s = state;
if (s >= INTERRUPTING)
handlePossibleCancellationInterrupt(s);
}
}
3.FutureTask构造的时候需要一个Callable<V>参数, Callable表示一个任务的执行过程, 在run方法中恰好调用了Callable.call(), 也就是任务工作在工作线程中执行。
4.那么任务执行完了会返回结果, 这个结果是要在submit线程(就是提交任务的线程)中使用的, 那么如何让submit线程可以反问到呢? 答案也是在FutureTask类中, 我们可以看到run方法中执行任务(Callable.call())获取结果后, 会掉用一个set()方法, set方法源码如下:
protected void set(V v) {
if (UNSAFE.compareAndSwapInt(this, stateOffset, NEW, COMPLETING)) {
outcome = v;
UNSAFE.putOrderedInt(this, stateOffset, NORMAL); // final state
finishCompletion();
}
}
5.set() 将获取的结果存储到FuturnTask的一个outcome字段中, 这个过程是同步的, 所以其他线程稍后访问是可以读取到值的。
6.ExecutorCompletionService中的完成队列中正好存储的是FuturnTask的子类, 当然可以调用FutureTask的get方法, FutureTask的get方法就是获取outcome值 (get()方法中调用了report()方法, report中返回了outcome字段)。
7.FuturnTask中委托的任务执行完成后, 会掉一个done()方法, 这个方法是个空方法, 而其子类QueueingFuture重写了此方法, 如下:
protected void done() { completionQueue.add(task); }
正是在此方法中把执行完的任务放置到完成队列中的!
至此, ExecutorCompletionService原理已经解析完毕~