归并算法(归并排序)

归并算法(归并排序

这周需要用到归并算法, 于是找了找相关的资料, 整理如下:
归并排序(Merge Sort)是利用"归并"技术来进行排序。归并是指将若干个已排序的子文件合并成一个有序的文件。

两路归并算法
1、算法基本思路
     　设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上：R[low..m]，R[m+1..high]，先将它们合并到一个局部的暂存向量R1(相当于输出堆)中，待合并完成后将R1复制回R[low..high]中。
（1）合并过程
     　合并过程中，设置i，j和p三个指针，其初值分别指向这三个记录区的起始位置。合并时依次比较R[i]和R[j]的关键字，取关键字较小的记录复制到R1[p]中，然后将被复制记录的指针i或j加1，以及指向复制位置的指针p加1。
     　重复这一过程直至两个输入的子文件有一个已全部复制完毕(不妨称其为空)，此时将另一非空的子文件中剩余记录依次复制到R1中即可。
（2）动态申请R1
     　实现时，R1是动态申请的，因为申请的空间可能很大，故须加入申请空间是否成功的处理。
、归并算法
   void Merge(SeqList R，int low，int m，int high)
     {//将两个有序的子文件R[low..m)和R[m+1..high]归并成一个有序的
      //子文件R[low..high]
      int i=low，j=m+1，p=0； //置初始值
      RecType *R1； //R1是局部向量，若p定义为此类型指针速度更快
      R1=(ReeType *)malloc((high-low+1)*sizeof(RecType))；
      if(! R1) //申请空间失败
        Error("Insufficient memory available!")；
      while(i<=m&&j<=high) //两子文件非空时取其小者输出到R1[p]上
        R1[p++]=(R[i].key<=R[j].key)?R[i++]：R[j++]；
      while(i<=m) //若第1个子文件非空，则复制剩余记录到R1中
        R1[p++]=R[i++]；
      while(j<=high) //若第2个子文件非空，则复制剩余记录到R1中
        R1[p++]=R[j++]；
      for(p=0，i=low；i<=high；p++，i++)
        R[i]=R1[p]；//归并完成后将结果复制回R[low..high]
     } //Merge

归并排序
归并排序有两种实现方法：自底向上和自顶向下。

1、自底向上的方法
（1）自底向上的基本思想
      自底向上的基本思想是：第1趟归并排序时，将待排序的文件R[1..n]看作是n个长度为1的有序子文件，将这些子文件两两归并，若n为偶数，则得到个长度为2的有序子文件；若n为奇数，则最后一个子文件轮空(不参与归并)。故本趟归并完成后，前个有序子文件长度为2，但最后一个子文件长度仍为1；第2趟归并则是将第1趟归并所得到的个有序的子文件两两归并，如此反复，直到最后得到一个长度为n的有序文件为止。
     上述的每次归并操作，均是将两个有序的子文件合并成一个有序的子文件，故称其为"二路归并排序"。类似地有k(k>2)路归并排序。
（2）一趟归并算法
分析：
      在某趟归并中，设各子文件长度为length(最后一个子文件的长度可能小于length)，则归并前R[1..n]中共有个有序的子文件：R[1..length]，R[length+1..2length]，…，。
注意：
      调用归并操作将相邻的一对子文件进行归并时，必须对子文件的个数可能是奇数、以及最后一个子文件的长度小于length这两种特殊情况进行特殊处理：
① 若子文件个数为奇数，则最后一个子文件无须和其它子文件归并(即本趟轮空)；
② 若子文件个数为偶数，则要注意最后一对子文件中后一子文件的区间上界是n。

具体算法如下：
     void MergePass(SeqList R，int length)
      { //对R[1..n]做一趟归并排序
       int i；
       for(i=1;i+2*length-1<=n;i=i+2*length)
       Merge(R，i，i+length-1，i+2*length-1)；
            //归并长度为length的两个相邻子文件
       if(i+length-1<n) //尚有两个子文件，其中后一个长度小于length
          Merge(R，i，i+length-1，n)； //归并最后两个子文件
       //注意：若i≤n且i+length-1≥n时，则剩余一个子文件轮空，无须归并
      } //MergePass
（3）二路归并排序算法
   void MergeSort(SeqList R)
    {//采用自底向上的方法，对R[1..n]进行二路归并排序
      int length；
      for(1ength=1；length<n；length*=2) //做趟归并
MergePass(R，length)； //有序段长度≥n时终止
    }

注意：
      自底向上的归并排序算法虽然效率较高，但可读性较差。
2、自顶向下的方法
      采用分治法进行自顶向下的算法设计，形式更为简洁。
（1）分治法的三个步骤
      设归并排序的当前区间是R[low..high]，分治法的三个步骤是：
①分解：将当前区间一分为二，即求分裂点

②求解：递归地对两个子区间R[low..mid]和R[mid+1..high]进行归并排序；
③组合：将已排序的两个子区间R[low..mid]和R[mid+1..high]归并为一个有序的区间R[low..high]。
   递归的终结条件：子区间长度为1（一个记录自然有序）。
（2）具体算法
     void MergeSortDC(SeqList R，int low，int high)
      {//用分治法对R[low..high]进行二路归并排序
        int mid；
        if(low<high){//区间长度大于1
           mid=(low+high)/2； //分解
           MergeSortDC(R，low，mid); //递归地对R[low..mid]排序
           MergeSortDC(R，mid+1，high)； //递归地对R[mid+1..high]排序
           Merge(R，low，mid，high)； //组合，将两个有序区归并为一个有序区
         }
      }//MergeSortDC

二、算法分析
1、稳定性
      　归并排序是一种稳定的排序。
2、存储结构要求
     　可用顺序存储结构。也易于在链表上实现。
3、时间复杂度
     　对长度为n的文件，需进行趟二路归并，每趟归并的时间为O(n)，故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。
4、空间复杂度
    　需要一个辅助向量来暂存两有序子文件归并的结果，故其辅助空间复杂度为O(n)，显然它不是就地排序。
注意：
     　若用单链表做存储结构，很容易给出就地的归并排序
归并算法将两个有序的数组合并到一个数组中并使之有序，这两个数组并不一定相同大小，但需要一个额外的数组存放归并结果。算法比较两个数组相同位置的元素，将小的放入结果数组中，如此往复，如果其中一个先到达末尾，则将另外一个剩下部分放入结果数组中。
   归并排序将数组不断划分, 第一次分成两半, 第二次分成四份, 如此直到得到只有一个元素的数组返回, 假定一个元素是有序的, 然后将两个数据项归并到两个元素的有序数组中, 再次返回, 将这一对两个元素的数组归并到一个四个元素的数组中, 返回最外层的时候, 这个数组将会有两个分别有序的子数组, 再次归并则完成排序.

下面是合并两个数组的代码，其实是归并排序的一部分。
///////////////// merge sort ///////////////
/ lowPtr: 第一个数组的起始索引，
//highPtr: 第二个数组的起始索引.
//upperBound: 第二个数组的最大索引.
private void merge (int lowPtr, int highPtr, int upperBound) {
   int idx = 0;          //结果数组的索引初始为0
   int lowerBound = lowPtr; //保存第一个数组的起始点
   int middle = highPtr - 1;   //第一个数组的最大索引. 因为要归并的两个数组相邻.
// 只要有一个数组到达末尾就结束
while (lowPtr <= middle && highPtr <= upperBound) {
   if ( array[lowPtr] < array[highPtr] ) { //哪个小就放进结果数组
     workspace[idx++] = array [lowPtr++];
    }
   else{
     workspace[idx++] = array [highPtr++];
    }
   }
while (lowPtr <= middle) { //第二个数组先结束了
    workspace[idx++] = array[lowPtr++];
   }
while (highPtr <= upperBound ) { //第一个数组先结束了
workspace[idx++] = array[highPtr++];
   }
//将结果数组里的归并后元素拷回原数组
for ( int i = 0; i
array [lowerBound+i] = workspace [i];
   }
}
划分数组则简单地用递归的方法,下面是排序的方法.

//lowerBound: 待排序数组的起始索引
//upperBound: 待排序数组的结束索引
private void sort (int lowerBound, int upperBound) {
if (lowerBound == upperBound) { //如果只有一个元素了就返回
    return;
   }
else {
    int mid = (lowerBound + upperBound) / 2; //找到中间位置
sort (lowerBound, mid); //排左边
    sort (mid+1, upperBound); //排右边
merge (lowerBound, mid+1, upperBound); //归并
   }
}
对于N个元素的数组来说, 如此划分需要的层数是以2为底N的对数, 每一层中, 每一个元素都要复制到结果数组中, 并复制回来, 所以复制2N次, 那么对于归并排序,它的时间复杂度为O(N*logN), 而比较次数会少得多, 最少需要N/2次,最多为N-1次, 所以平均比较次数在两者之间. 它的主要问题还是在于在内存中需要双倍的空间.

posted on 2013-10-14 14:01 smart0326 阅读(878) 评论(0) 编辑收藏举报