文件归并排序算法系列之合并排序

改章节是一篇关于文件归并的帖子

 

         归并排序(Merge sort,合并排序)是建立在归并操纵上的一种效有的排序法算。该法算是用采分治法(Divide and Conquer)的一个非常典范的用应。

    

一 归并操纵

    

基本思想

        归并操纵(merge),指的是将两个经已排序的序列合并成一个序列的操纵,归并排序法算赖依归并操纵。

    归并操纵的进程如下:

    

  1. 请申空间,使其小大为两个经已排序序列之和,该空间用来放存合并后的序列
  2. 设定两个指针,最初置位别分为两个经已排序序列的肇端置位
  3. 比拟两个指针所指向的素元,选择对相小的素元放入到合并空间,并挪动指针到下一置位
  4. 重复步调3直到某一指针到达序列尾
  5. 将另外一序列剩下的全部素元直接制复到合并序列尾

    

归并操纵法算实现(c/c++)

void Merge(SeqList R,int low,int m,int high)
{//将两个有序的子文件R[low..m)和R[m+1..high]归并成一个有序的子文件R[low..high]
     int i=low,j=m+1,p=0; //置初始值
     RecType *R1; //R1是局部量向,若p定义为此类型指针速度更快
     R1=(ReeType *)malloc((high-low+1)*sizeof(RecType));
     if(! R1) //请申空间失败
       Error("Insufficient memory available!");
     while(i<=m&&j<=high) //两子文件非空时取其小者输出到R1[p]上
       R1[p++]=(R[i].key<=R[j].key)?R[i++]:R[j++];
     while(i<=m) //若第1个子文件非空,则制复余剩记载到R1中
       R1[p++]=R[i++];
     while(j<=high) //若第2个子文件非空,则制复余剩记载到R1中
       R1[p++]=R[j++];
     for(p=0,i=low;i<=high;p++,i++)
       R[i]=R1[p];//归并完成后将结果制复回R[low..high]
} //Merge

    

二 归并排序

       归并排序是基于归并操纵的排序法算,有多路归并排序、两路归并排序 , 可用于内排序,也可以用于外排序

    

两路归并排序

    

基本思路

        设两个有序的子文件(相当于输入堆)放在统一量向中相邻的置位上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存量向R1(相当于输出堆)中,待合并完成后将R1制复回R[low..high]中。
(1)合并进程
    合并进程中,置设i,j和p三个指针,其值初别分指向这三个记载区的肇端置位。合并时顺次比拟R[i]和R[j]的关键字,取关键字较小的记载制复到R1[p]中,然后将被制复记载的指针i或j加1,以及指向制复置位的指针p加1。
    重复这一进程直至两个输入的子文件有一个已全体制复毕完(不妨称其为空),此时将另外一非空的子文件中余剩记载顺次制复到R1中可即。
(2)态动请申R1
    实现时,R1是态动请申的,因为请申的空间可能很大,故须参加请申空间否是功成的理处。

    

法算实现

    

自底向上的方法

    (1) 自底向上的基本思想
     自底向上的基本思想是:第1趟归并排序时,将待排序的文件R[1..n]看做是n个长度为1的有序子文件,将这些子文件两两归并,若n为偶数,则失掉文件和归并 个长度为2的有序子文件;若n为奇数,则最后一个子文件轮空(不介入归并)。故本趟归并完成后,前文件和归并 个有序子文件长度为2,但最后一个子文件长度仍为1;第2趟归并则是将第1趟归并所失掉的文件和归并 个有序的子文件两两归并,如此重复,直到最后失掉一个长度为n的有序文件为止。
     上述的每次归并操纵,均是将两个有序的子文件合并成一个有序的子文件,故称其为"二路归并排序"。类似地有k(k>2)路归并排序。
(2) 二路归并排序的法算演示
  【拜见动画演示
(3) 一趟归并法算
 
分析:
       在某趟归并中,设各子文件长度为length(最后一个子文件的长度可能小于length),则归并前R[1..n]中共有文件和归并个有序的子文件:

    每日一道理
即使青春是一枝娇艳的花,但我明白,一枝独放永远不是春天,春天该是万紫千红的世界。 即使青春是一株大地伟岸的树,但我明白,一株独秀永远不是挺拔,成行成排的林木,才是遮风挡沙的绿色长城。即使青春是一叶大海孤高的帆,但我明白,一叶孤帆很难远航,千帆竞发才是大海的壮观。

    R[1..length],[length+1..2length],…,文件和归并
注意:
     调用归并操纵将相邻的一对子文件行进归并时,必须对子文件的个数多是奇数、以及最后一个子文件的长度小于length这两种特别情况行进特别理处:
① 若子文件个数为奇数,则最后一个子文件须无和其它子文件归并(即本趟轮空);
② 若子文件个数为偶数,则要注意最后一对子文件中后一子文件的间区上界是n。

    
体具实现法算:

void MergePass(SeqList R,int length)
{ //对R[1..n]做一趟归并排序
   int i;
   for(i=1;i+2*length-1<=n;i=i+2*length)
   Merge(R,i,i+length-1,i+2*length-1);
      //归并长度为length的两个相邻子文件
   if(i+length-1<n) //有尚两个子文件,其中后一个长度小于length
      Merge(R,i,i+length-1,n); //归并最后两个子文件
   //注意:若i≤n且i+length-1≥n时,则余剩一个子文件轮空,须无归并
} //MergePass

    (4)二路归并排序法算

void MergeSort(SeqList R)
{//用采自底向上的方法,对R[1..n]行进二路归并排序
   int length;
   for(1ength=1;length<n;length*=2) //做 趟归并
      MergePass(R,length); //有序段长度≥n时止终
}

    注意:
     自底向上的归并排序法算虽然效率较高,但可读性较差。

    

自顶向下的方法

         用采分治法行进自顶向下的法算计设,式形更为洁简。

(1)分治法的三个步调
     设归并排序的前当间区是R[low..high],分治法的三个步调是:
①解分:将前当间区一分为二,即求分裂点
                 文件和归并
②求解:递归地对两个子间区R[low..mid]和R[mid+1..high]行进归并排序;
③合组:将已排序的两个子间区R[low..mid]和R[mid+1..high]归并为一个有序的间区R[low..high]。
  递归的结终件条:子间区长度为1(一个记载天然有序)。

(2)体具法算

void MergeSortDC(SeqList R,int low,int high)
{//用分治法对R[low..high]行进二路归并排序
   int mid;
   if(low<high){//间区长度大于1
      mid=(low+high)/2; //解分
       MergeSortDC(R,low,mid); //递归地对R[low..mid]排序
       MergeSortDC(R,mid+1,high); //递归地对R[mid+1..high]排序
       Merge(R,low,mid,high); //合组,将两个有序区归并为一个有序区
   }
}//MergeSortDC

    
(3)法算MergeSortDC的执行进程
     法算MergeSortDC的执行进程如下图所示的递归树。
文件和归并

                    归并排序示例: 自顶向下的二路归并的执行进程

    

三 法算团体进程演示

        一个归并排序的例子:对一个随机点的链表行进排序:

    文件和归并

    

四 法算性能分析

    1、定稳性
     归并排序是一种定稳的排序。
2、存储结构要求
    可用顺序存储结构。也易于在链表上实现。
3、时光复杂度
    对长度为n的文件,需行进文件和归并 趟二路归并,每趟归并的时光为O(n),故其时光复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。
4、空间复杂度
    须要一个帮助量向来暂存两有序子文件归并的结果,故其帮助空间复杂度为O(n),然显它不是就地排序。

    

五 参考文献

    1. 两路归并:http://student.zjzk.cn/course_ware/data_structure/web/paixu/paixu8.5.1.3.htm

    2. 维基百科:http://zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F

    3. 法算导论

文章结束给大家分享下程序员的一些笑话语录: 3G普不普及现在已经不是看终端了,而是看应用,有好的,便宜实用的应用,花1000多买个能用的智能手机应该不是什么难事。反过来说,你200元拿一个智能手机,没有好的应用,看个电影要几十元,也是没人用3G。

posted @ 2013-05-08 20:09  xinyuyuanm  阅读(938)  评论(0编辑  收藏  举报