冬Blog

醉心技术、醉心生活
  博客园  :: 首页  :: 新随笔  :: 订阅 订阅  :: 管理

起泡的并行算法(MPI)

Posted on 2007-10-23 18:11  冬冬  阅读(1302)  评论(0编辑  收藏  举报
  1 //=================================================================
  2 // Name : 基于分段的平行排序
  3 // Author : 袁冬(2107020046)
  4 // Copyright : 中国海洋大学
  5 // LastUpdate : 2007.10.03    
  6 // Develop Evrionment : Windows Server 2003 SP2
  7 //                        + Eclipse 3.3.1 + CDT 4.0.1 
  8 //                        + MinGW 3.81 + GDB 6.6 
  9 //                        + mpich2-1.0.6-win32-ia32
 10 //=================================================================
 11 
 12 /*
 13  * 算法描述: 分段 -> 段内排序 -> 归约结果。
 14  * 1,根进程读取输入,将元素个数广播给各个进程。
 15  * 2,然后各进程计算段长度和段偏移。
 16  * 3,然后根进程选择第一个段,标记站位符。
 17  * 4,跟进程将剩余元素发送给下一进程,下一进程选择段的同时,根进程排序。
 18  * 5,下一进程继续此过程,直到最后一个进程,所有元素都进行排序。
 19  * 6,进程将排序好的元素,按照段偏移归约给根进程。
 20  * 7,根进程输入结果。
 21  * 
 22  * 时间复杂度计算:
 23  * 设共有进程p,共有元素n
 24  * 则段数为p,每段长度为m = n / p
 25  * 最长时间为从根进程分段开始,至末进程规约为止,又注意到,分段时串行进行的,故
 26  * 
 27  *         t = 分段时间 * 段数 + 最后一段的排序时间
 28  * 
 29  * 用大欧米伽表示法表示
 30  * 
 31  *         O(分段时间) = m * n = n * n / p
 32  *         O(最后一段的排序时间) = m * m
 33  * 
 34  * 所以
 35  * 
 36  *         O(t) = n * n / p * p + m * m
 37  *              = n * n + m * m; 
 38  *              = n * n
 39  * 
 40  * 所以,此算法排序时间复杂度为n的平方,和起泡排序的时间复杂度相同。
 41  * 
 42  * 分析与优化:
 43  * 从时间复杂度的分析可以知道,算法的瓶颈在于分段算法,因为该算法从本质上讲,是串行进行的。
 44  * 因个人水平有限,分段没有找到并行算法,导致整个算法为伪并行。
 45  * 但是有一个办法可以将分算法的时间减半,
 46  * 即从最大和最小两边开始,分别进行分组,可以使时间复杂度减低一半,但总体时间复杂度的O认为n*n。
 47  * 
 48  * 另外,在“取得当前段”的算法中,如果每次循环i时,段索引没有改变,再下一轮时,可以不再遍历。
 49  * 相当于加入缓存,估计此缓存命中几率比较高,可以较大幅度的改善时间复杂度。
 50  * 
 51  */
 52 
 53 //#define DEBUG 1 //调试符号
 54 
 55 #define TRUE 1
 56 #define FALSE 0
 57 #define Bool int
 58 
 59 #define MAX_LENGTH 100 //允许的最大元素个数
 60 #define MAX_LENGTH_WITH_MARK 200 //允许的最大元素数及其对应的标记的长度,此值应为MAX_LENGTH的两倍
 61 
 62 #include "mpi.h"
 63 #include <stdio.h>
 64 #include <stdlib.h>
 65 
 66 int pID, pSize; //pID:当前进程ID,pSize:总的进程数
 67 int input[MAX_LENGTH][2], length, packageSize; //input:输入,length:输入的元素个数,packageSize:段大小
 68 int result[MAX_LENGTH], finalResult[MAX_LENGTH], packageIndex[MAX_LENGTH]; //result:当前结果,finalResult:最终结果,packageIndex:段值索引
 69 int resultOffset; //resultOffset:短偏移
 70 
 71 //读取输入
 72 void read() {
 73     int i;
 74     //读取元素个数
 75     printf("Input the length of the array:");
 76     fflush(stdout);
 77     scanf("%d"&length);
 78     
 79     //读取元素
 80     printf("Input the element of the array total %d:", length);
 81     fflush(stdout);
 82     for (i = 0; i < length; i++) {
 83         //读取元素,经对应站位标记标记为0
 84         scanf("%d"&input[i][0]);
 85         input[i][1= 0;
 86     }
 87 }
 88 //输出
 89 void output() {
 90     int i;
 91     for (i = 0; i < length; i++)
 92         printf("%d ", finalResult[i]);
 93     fflush(stdout);
 94 }
 95 
 96 //准备:计算进程常量
 97 int prepare() {
 98     packageSize = length / pSize; //段大小
 99     resultOffset = packageSize * pID; //结果起始偏移值,表示该段位于整体的哪个部分
100 
101     //对于最后一个进程,需要修正段大小,包含所有余下的元素
102     if (pID == pSize - 1)
103         packageSize += length % pSize;
104 
105 #ifdef DEBUG
106     //调试信息:段大小
107     printf("resultOffset: %d, From %d.\n", resultOffset, pID);
108 #endif
109 }
110 
111 //分段,取得当前进程负责的段
112 void findCurrentRange() {
113     int i, j = 0, maxIndex, beginIndex = 0;
114     
115     //填充默认的值
116     for (i = 0; i < packageSize; i++) {
117         while (input[beginIndex][1])
118             beginIndex++;
119         packageIndex[i] = beginIndex;
120         beginIndex++;
121     }
122 
123 #ifdef DEBUG    
124     //调试信息:默认值
125     for (i = 0; i < packageSize; i++)
126         printf("%d", packageIndex[i]);
127     printf(" From %d\n", pID);
128 #endif
129 
130     //查找所有元素,找到最小的packageSize个元素,取得其索引值
131     for (i = beginIndex; i < length; i++) {
132         //忽略被其他进程占用的元素
133         if (input[i][1])
134             continue;
135         
136         //查找比当前元素索引中最大的元素的索引
137         maxIndex = 0;
138         for (j = 1; j < packageSize; j++)
139             if (input[packageIndex[j]][0> input[packageIndex[maxIndex]][0])
140                 maxIndex = j;
141         
142         //如果元素索引中的最大的小于当前元素,则替换
143         if (input[packageIndex[maxIndex]][0> input[i][0])
144             packageIndex[maxIndex] = i;
145     }
146 #ifdef DEBUG    
147     //调试信息:当前段索引,用于判断是否取得了正确的段索引
148     for (i = 0; i < packageSize; i++)
149         printf("%d", packageIndex[i]);
150     printf(" From %d\n", pID);
151 #endif
152     
153     //将索引转化为值,存放在result中,并标记输入信息,表明已占用
154     for (j = 0; j < packageSize; j++) {
155         result[resultOffset + j] = input[packageIndex[j]][0];
156         input[packageIndex[j]][1= 1;
157     }
158 
159 #ifdef DEBUG    
160     //调试信息:排序前的当前段,用于判断是否取得了正确的段
161     for (i = 0; i < length; i++)
162         printf("%d", result[i]);
163     printf(" From %d\n", pID);
164 #endif
165 }
166 //排序一个段
167 void sort() {
168     //段内起泡
169     int i, j, temp;
170     for (i = 0; i < packageSize; i++)
171         for (j = 0; j < packageSize; j++) {
172             if (result[resultOffset + i] < result[resultOffset + j]) {
173                 temp = result[resultOffset + i];
174                 result[resultOffset + i] = result[resultOffset + j];
175                 result[resultOffset + j] = temp;
176             }
177         }
178 #ifdef DEBUG
179     //调试信息:排序后的当前段
180     for (i = 0; i < length; i++)
181         printf("%d", result[i]);
182     printf(" From %d\n", pID);
183 #endif
184 }
185 //主处理进程
186 void process() {
187     //取得该进程负责的段
188     findCurrentRange();
189     //如果此进程不是最后一个进程,则将剩余部分传递给下一个进程
190     if (pID != pSize - 1)
191         MPI_Send(input, MAX_LENGTH_WITH_MARK, MPI_INT, pID + 10, MPI_COMM_WORLD);
192 
193     //排序当前进程负责的段
194     sort();
195     //归约结果,因为最终结果初始皆为零,故采用求和的形式归约当前结果到最终结果
196     MPI_Reduce(result, finalResult, MAX_LENGTH_WITH_MARK, MPI_INT, MPI_SUM, 0,
197             MPI_COMM_WORLD);
198 }
199 
200 //入口,主函数
201 int main(int argc, char* argv[]) {
202     MPI_Status status; //无用
203 
204     MPI_Init(&argc, &argv); //初始化
205     MPI_Comm_rank(MPI_COMM_WORLD, &pID); //取得当前进程的ID
206     MPI_Comm_size(MPI_COMM_WORLD, &pSize); //取得总进程数
207     
208     //根进程负责输入
209     if (!pID)
210         read();
211 
212     //广播输入数数组的长度
213     MPI_Bcast(&length, 1, MPI_INT, 0, MPI_COMM_WORLD);
214     //准备:计算各进程常量
215     prepare();
216     
217     //从根进程启动,处理第一段
218     if (!pID)
219         process();
220     else {
221         //其余进程等待上一进程传递的数据
222         MPI_Recv(input, MAX_LENGTH_WITH_MARK, MPI_INT, pID - 10, MPI_COMM_WORLD,
223                 &status);
224         //收到数据后进行处理
225         process();
226     }
227 
228     //根进程负责输出
229     if (!pID)
230         output();
231 
232     //结束
233     MPI_Finalize();
234     return 0;
235 }
236