并行设计模式(二)-- Master-Worker模式

  Java多线程编程中,常用的多线程设计模式包括:Future模式、Master-Worker模式、Guarded Suspeionsion模式、不变模式和生产者-消费者模式等。这篇文章主要讲述Master-Worker模式,关于其他多线程设计模式的地址如下:
  关于Future模式的详解: 并行设计模式(一)-- Future模式
  关于Guarded Suspeionsion模式的详解: 并行设计模式(三)-- Guarded Suspeionsion模式
  关于不变模式的详解: 并行设计模式(四)-- 不变模式
  关于生产者-消费者模式的详解:并行设计模式(五)-- 生产者-消费者模式

 1. Master-Worker模式

  Master-Worker模式是常用的并行模式之一,它的核心思想是:系统由两类进程协同工作,即Master进程和Worker进程,Master负责接收和分配任务,Wroker负责处理子任务。当各个Worker进程将子任务处理完成后,将结果返回给Master进程,由Master进程进行汇总,从而得到最终的结果,其具体处理过程如下图所示。

//img-blog.csdn.net/20141113102527554

 

  Master-Worker 模式的好处,它能够将一个大任务分解成若干个小任务并行执行,从而提高系统的吞吐量。而对于系统请求者 Client 来说,任务一旦提交,Master进程会分配任务并立即返回,并不会等待系统全部处理完成后再返回,其处理过程是异步的。因此,Client 不会出现等待现象。

2. Master-Worker模式结构

  Master-Worker 模式的结构相对比较简单,Master 进程为主要进程,它维护了一个Worker 进程队列、子任务队列和子结果集、Worker 进程队列中的 Worker 进程,不停地从任务队列中提取要处理的子任务,并将子任务的处理结果写入结果集。具体的结构图如下所示:

注意:Master-Worker 模式是一种使用多线程进行数据处理的结构。多个 Worker 进程协作处理用户请求,Master 进程负责维护 Worker 进程,并整合最终处理结果。

3. 代码实现

  Master-Worker 主要角色分配如下所示:

角 色 作 用

            Worker

 用于实际处理一个任务

            Master

 用于任务的分配和最终结果的合成

           Main

 启动系统,调用开启Master

下面是一个简易版的 Master-Worker 框架 Java 代码实现

1. Master 部分源码实现:

 1 import java.util.HashMap;
 2 import java.util.Map;
 3 import java.util.Queue;
 4 import java.util.concurrent.ConcurrentHashMap;
 5 import java.util.concurrent.ConcurrentLinkedQueue;
 6 
 7 public class Master {
 8     // 任务队列
 9     protected Queue<Object> workQueue = new ConcurrentLinkedQueue<Object>();
10     // Worker进程队列
11     protected Map<String, Thread> threadMap = new HashMap<String, Thread>();
12     // 子任务处理结果集
13     protected Map<String, Object> resultMap = new ConcurrentHashMap<String, Object>();
14     // 构造函数
15     public Master(Worker worker, int countWorker) {
16         worker.setWorkQueue(workQueue); //添加任务队列
17         worker.setResultMap(resultMap); //添加计算结果集合
18         for(int i=0; i<countWorker; i++) {
19             threadMap.put(Integer.toString(i), new Thread(worker, Integer.toString(i))); //循环添加任务进程
20         }
21     }
22     
23     //是否所有的子任务都结束了
24     public boolean isComplete() {
25         for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {
26             if(entry.getValue().getState() != Thread.State.TERMINATED)
27                 return false; //存在未完成的任务
28         }
29         return true;
30     }
31     
32     //提交一个子任务
33     public void submit(Object job) {
34         workQueue.add(job);
35     }
36     
37     //返回子任务结果集
38     public Map<String, Object> getResultMap() {
39         return resultMap;
40     }
41     
42     //执行所有Worker进程,进行处理
43     public void execute() {
44         for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {
45             entry.getValue().start();
46         }
47     }
48 }

2. Worker 进程的源代码实现

 1 import java.util.Map;
 2 import java.util.Queue;
 3 
 4 public class Worker  implements Runnable{
 5     //任务队列,用于取得子任务
 6     protected Queue<Object> workQueue;
 7     //子任务处理结果集
 8     protected Map<String ,Object> resultMap;
 9     public void setWorkQueue(Queue<Object> workQueue){
10         this.workQueue= workQueue;
11     }
12     public void setResultMap(Map<String ,Object> resultMap){
13         this.resultMap=resultMap;
14     }
15     //子任务处理的逻辑,在子类中实现具体逻辑
16     public Object handle(Object input){
17         return input;
18     }
19     
20     @Override
21     public void run() {
22         while(true){
23             //获取子任务
24             Object input= workQueue.poll();
25             if(input==null){
26                 break;
27             }
28             //处理子任务
29             Object re = handle(input);
30             resultMap.put(Integer.toString(input.hashCode()), re);
31         }
32     }
33 }

  以上两段代码已经展示了 Master-Worker 框架的全貌。应用程序中通过重载Worker.handle()方法实现应用层逻辑。

注意:Master-Worker 模式是一种将串行任务并行化的方法,被分解的子任务在系统中可以被并行处理。同时,如果有需要,Master 进程不需要等待所有子任务都完成计算,就可以根据已有的部分结果集计算最终结果。

  现应用这个 Master-Worker 框架,实现一个计算立方和的应用,并计算 1 ~~ 100 的立方和,即 13 + 23  + 33 + ... + 1003

  计算任务可被分解为 100 个子任务,每个子任务仅用于计算单独的立方和。Master 产生固定个数的 Worker 来处理所有这些子任务。Worker 不断地从任务集合中取得这些计算立方和的子任务,并将计算结果返回给 Master。Master 负责将所有 Worker 的任务结果进行累加,从而产生最终的立方和。在整个计算过程中,Master 与 Worker 的运行也是完全异步的,Master 不必等到所有的 Worker 都执行完成后,就可以进行求和操作。即,Master 在获得部分子任务结果集时,就已经可以开始对最终结果进行计算,从而进一步提高系统的并行度和吞吐量。具体的任务分解如下图所示:

  

3.子任务 PlusWork 源码实现

  计算任务被划分成100个子任务,每个任务仅仅用于计算单独的立方和,对应的 PlusWork 源码如下:

public class PlusWorker extends Worker { //求立方和
    @Override
    public Object handle(Object input) {
        int i = (Integer)input;
        return i * i * i;
    }
}

4. 进行计算的 Main 函数

  运行的调用函数如下。在主函数中首先通过Master类创建5个Worker工作进程和Worker工作实例PlusWorker。在提交了100个子任务后,边开始子任务的计算。这些子任务中由这5个进程共同完成。Master不用等待所有Worker计算完成才开始汇总,而是子任务在计算的过程中,Master就开始汇总了。

 1 import java.util.Map;
 2 import java.util.Set;
 3 
 4 public class Application {
 5     public static void main(String[] args) {
 6         //固定使用5个Workde
 7         Master master = new Master(new PlusWorker(), 5);
 8         for(int i=1; i<=100; i++) //提交100个子任务
 9             master.submit(i);
10         master.execute(); //开始计算
11         int re = 0;  //最终计算结果保存在此
12         Map<String, Object> resultMap = master.getResultMap();
13         
14         while(true) {//不需要等待所有Worker都执行完成,即可开始计算最终结果
15             Set<String> keys = resultMap.keySet();  //开始计算最终结果
16             String key = null;
17             for(String k : keys) {
18                 key = k;
19                 break;
20             }
21             Integer i = null;
22             if(key != null)
23                 i = (Integer)resultMap.get(key);
24             if(i != null)
25                 re += i; //最终结果
26             if(key != null)
27                 resultMap.remove(key); //移除已被计算过的项目
28             if(master.isComplete() && resultMap.size()==0)
29                 break;
30         }
31         System.out.println(re);
32     }
33 }

运行结果:

25502500

 总结:

  重要的事情说三遍,Master-Worker 模式是一种将串行任务并行化的方案,被分解的子任务在系统中可以被并行处理,同时,如果有需要,Master进程不需要等待所有子任务都完成计算,就可以根据已有的部分结果集计算最终结果集。

 

posted @ 2017-02-26 22:50  星火燎原智勇  阅读(3526)  评论(0编辑  收藏  举报