JAVA并发工具类---------------(Fork/Join)

Fork/Join

分而治之

将一个大任务分成数个小任务执行，然后将这些小人物执行后的结果进行join汇总；

（假设：你要计算1到1000的总和，你可以把它分成1-100，101-200，......,901-1000几组完成，然后再把这几组的结果相加）

工作窃取

有一个较大的任务划分成了10个小任务。
这10个小任务在一个大小为2的线程池中执行。
线程池中的2个核心线程，每个线程的队列中有5个任务。
线程1的任务都很简单，所以它很快就将5个任务执行完毕。
线程2的任务都很复杂，当线程1执行完5个任务时，他才执行了3个任务。
这时，线程1不会空闲，而且窃取线程2的等待队列中的任务(从末端开始窃取)来执行。
当线程2的队列中也没有了任务之后，线程1和线程2才空闲。

（假设：你和同事执行相同的任务，你执行的任务快，但是你的同事执行很慢，你把你的任务执行完成后，你会帮你的同事执行一部分任务，然后再偷偷将完成的任务放在你同事的任务完成列表里面）

ForkJoin的主要类

ForkJoinPool：ForkJoin线程池，实现了ExecutorService接口和工作窃取算法，用于线程调度与管理。
ForkJoinTask：ForkJoin任务，提供了fork()方法和join()方法。通常不直接使用，而是使用以下子类：
　　RecursiveAction：无返回值的任务，通常用于只fork不join的情形。
　　RecursiveTask：有返回值的任务，通常用于fork+join的情形。

ForkJoin的使用

一、创建Task
使用ForkJoin框架，需要创建一个ForkJoin的任务，而ForkJoinTask是一个抽象类，我们不需要去继承ForkJoinTask进行使用。因为ForkJoin框架为我们提供了RecursiveAction和RecursiveTask。我们只需要继承ForkJoin为我们提供的抽象类的其中一个并且实现compute方法。其中RecursiveAction没有返回结果，RecursiveTask执行后是有返回结果,看需使用。

二、使用ForkJoinPool进行执行
task要通过ForkJoinPool来执行，分割的子任务也会添加到当前工作线程的双端队列中，
进入队列的头部。当一个工作线程中没有任务时，会从其他工作线程的队列尾部获取一个任务(工作窃取)。

TASK任务类

package com.qr.fork_join.ListTskDemo;

import java.util.List;
import java.util.concurrent.RecursiveTask;

//
public class DemoTask extends RecursiveTask<Integer> {

    //传入的参数
    final List<Integer> list;

    public DemoTask(List<Integer> list) {
        this.list = list;
    }


    //需要执行的逻辑
    @Override
    protected Integer compute() {
        //分组条件
        if (list.size()<=10){
            //分组后需要执行的逻辑--计算总和
            int sum=0;
            for (Integer integer : list) {
                sum+=integer;
            }
            return sum;
        }
        // 执行子任务
        DemoTask task1=new DemoTask(list.subList(0, list.size() / 2) );
        DemoTask task2=new DemoTask( list.subList(list.size() / 2, list.size()) );

        //等待任务执行结束合并其结果
        task1.fork();
        task2.fork();
        //也可以使用 invokeAll(task1, task2);

        // 合并子任务
        return task1.join()+task2.join();
    }
}

主线程任务类

package com.qr.fork_join.ListTskDemo;

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.ForkJoinPool;

public class DemoTest {
    public static void main(String[] args) {
        long startTime1=System.currentTimeMillis();   //获取开始时间
        List<Integer> list=new ArrayList<Integer>();
        //正确的返回参数
        int sum=0;
        for (int i = 0; i <1000 ; i++) {
            sum+=i;
            list.add(i);
        }
        long endTime1=System.currentTimeMillis();   //获取开始时间
        System.out.println("单线程用时:"+(endTime1-startTime1)+"ms");

        long startTime2=System.currentTimeMillis();   //获取开始时间
        ForkJoinPool pool=new ForkJoinPool();
        DemoTask demoTask=new DemoTask(list);
        pool.submit(demoTask);
        try {
            //使用forkjoin框架返回的参数
            System.out.println(demoTask.get());
        } catch (InterruptedException e) {
            e.printStackTrace();
        } catch (ExecutionException e) {
            e.printStackTrace();
        }
        long endTime2=System.currentTimeMillis();   //获取开始时间
        System.out.println("多线程用时:"+(endTime2-startTime2)+"ms");
    }
}

执行结果

单线程用时:0ms
499500
多线程用时:76ms

重点注意

需要特别注意的是：

ForkJoinPool 使用submit 或 invoke 提交的区别：invoke是同步执行，调用之后需要等待任务完成，才能执行后面的代码；submit是异步执行，只有在Future调用get的时候会阻塞。
这里继承的是RecursiveTask，还可以继承RecursiveAction。前者适用于有返回值的场景，而后者适合于没有返回值的场景
这一点是最容易忽略的地方，其实这里执行子任务调用fork方法并不是最佳的选择，最佳的选择是invokeAll方法。
```
leftTask.fork();  
rightTask.fork();

替换为

invokeAll(leftTask, rightTask);
```

具体说一下原理：对于Fork/Join模式，假如Pool里面线程数量是固定的，那么调用子任务的fork方法相当于A先分工给B，然后A当监工不干活，B去完成A交代的任务。所以上面的模式相当于浪费了一个线程。那么如果使用invokeAll相当于A分工给B后，A和B都去完成工作。这样可以更好的利用线程池，缩短执行的时间。

ForkJoinTask

fork 方法

fork() 做的工作只有一件事，既是把任务推入当前工作线程的工作队列里。

1 public final ForkJoinTask<V> fork() {
2     Thread t;
3     if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)
4         ((ForkJoinWorkerThread)t).workQueue.push(this);
5     else
6         ForkJoinPool.common.externalPush(this);
7     return this;
8 }

join 方法

　join() 的工作则复杂得多，也是它可以使得线程免于被阻塞的原因。

检查调用 join() 的线程是否是 ForkJoinThread 线程。如果不是（例如 main 线程），则阻塞当前线程，等待任务完成。如果是，则不阻塞。
查看任务的完成状态，如果已经完成，直接返回结果。
如果任务尚未完成，但处于自己的工作队列内，则完成它。
如果任务已经被其他的工作线程偷走，则窃取这个小偷的工作队列内的任务（以 FIFO 方式）执行，以期帮助它早日完成预 join 的任务。
如果偷走任务的小偷也已经把自己的任务全部做完，正在等待需要 Join 的任务时，则找到小偷的小偷，帮助它完成它的任务。
递归地执行第 5 步。

ForkJoinPool

execute方法

异步，不返回结果

invoke方法

同步，返回结果

submit方法

异步，返回结果

posted @ 2019-09-16 21:45 九号云阅读(471) 评论(0) 编辑收藏举报

刷新页面返回顶部