排序系列算法——堆排序
堆:大根堆与小根堆
堆排序是建立在堆基础上的排序方法,首先了解一下什么是堆。
常用的堆一般有两种,大根堆和小根堆。堆可以看做是一棵二叉树,其父节点的值总是大于(大根堆)或者小于(小根堆)子节点的值。举一个例子:
图1 不满足堆的条件 图2大根堆 图3 小根堆
图1不是堆,因为不满足父节点的值大于或者小于子节点的值;
图2是大根堆,根节点是最大值,父节点都大于或等于子节点的值;
图3是小根堆,根节点是最小值,父节点都小于或等于子节点的值。
堆排序
下面以大根堆为例讲解堆排序:
大根堆有一个很好的性质,根节点的数值总是大于其他所有节点的数值,利用这个性质,可以实现排序的工作。堆排序的步骤可以描述如下:
1.构建大根堆。首先我们的原始数组一般情况下是不满足堆的条件,既然我们要可用大根段的性质进行排序,第一步当然是对原始数组进行处理,构建大根堆。
2.根节点数据处理以及大根堆重构。构建了大根堆之后,根节点的数据是最大值,将该数值取出,对剩下的元素重构大根堆,这时根节点是剩下元素的最大值,取出。只要不断重复上述的操作,不断取出未排序元素的最大值,直到未排序的元素只剩一个,就完成了排序工作。
说得有点抽象,直接用一个实际的例子说明堆排序的工作步骤:
对一个无序的序列A={5,4,17,13,15,12,10 }按从小到大进行排序,序列的下标分别为{1,2,3,4,5,6,7},A[i]表示下标为i的元素。
第一步:对无序的数组构造大根堆
大根堆的根节点是整个序列的最大值。
第二步:
将A[1]与A[7]互换,此时A[7]为序列的最大值,A[7]已经排序完毕,剩余的元素A[1]~A[6]形成新的未排序序列,由于此时序列不是大根堆,需要重构大根堆。
第三步:
将A[1]与A[6]互换,此时A[6]为序列的最大值,A[6]已经排序完毕,剩余的元素A[1]~A[5]形成新的未排序序列,由于此时序列不是大根堆,需要重构大根堆。
第四步:
将A[1]与A[5]互换,此时A[5]为序列的最大值,A[5]已经排序完毕,剩余的元素A[1]~A[4]形成新的未排序序列,由于此时序列不是大根堆,需要重构大根堆。
第五步:
将A[1]与A[4]互换,此时A[4]为序列的最大值,A[4]已经排序完毕,剩余的元素A[1]~A[3]形成新的未排序序列,由于此时序列不是大根堆,需要重构大根堆。
第六步:
将A[1]与A[3]互换,此时A[3]为序列的最大值,A[3]已经排序完毕,由于此时未排序的序列只剩下两个元素,而且A[0]>A[1],将A[0]与A[1]互换即可得到最终的已排序序列。
C++程序实现
从上述的排序过程可知,堆排序主要有两个过程,大根堆的构建与重构:
1、大根堆的重构
如何实现大根堆的重构?如果一个原有的数组满足大根堆的性质,而只有其中一个元素改变从而破坏了大根堆的性质,那么可以从该元素出发,不断”逐级下降“,让子节点小于等于父子节点,满足大根堆的性质。以一个实例说明重构的过程:
堆排序的过程中,每一次改变的只有根节点的元素,因此只需要从根节点出发,进行如上图的操作即可实现大根堆的重构。C++代码如下:
1 void ReBuildMaxHeap(int *array,int arraylength,int startIndex){ 2 int index=0; 3 //int j=0; 4 int max=0; 5 while((2*startIndex+1)<arraylength){ 6 index = startIndex; 7 max = array[index]; 8 if(max<(array[2*startIndex+1])){ 9 max=array[2*startIndex+1]; 10 index=2*startIndex+1; 11 } 12 if(2*startIndex+2<arraylength&&max<array[2*startIndex+2]){ 13 max=array[2*startIndex+2]; 14 index=2*startIndex+2; 15 } 16 if(index==startIndex){ 17 break; 18 } 19 swap(array,index,startIndex); 20 startIndex = index; 21 } 22 }
1、 构建大根堆。
要构建大根堆,只需要遍历所有非叶子节点元素,使其所有的叶子节点均不大于足该节点元素即可。构建大根堆自低向上对数组进行遍历,如果发现父节点的值小于子节点的值,则将父节点的值与子节点的最大值进行交换,保证父节点的数据总是大于子节点的数据。如果发生了数据的交换,有可能令子节点不满足大根堆条件,需要进行会输重构大根堆。以一个实际的例子说明构建大根堆的过程:
C++代码如下:
1 void createHeap(int *array,int length){ 2 int max=0; 3 int index=0; 4 for(int i=floor(length/2)-1;i>=0;i--){ 5 index = i; 6 max = array[i]; 7 if(max<array[2*i+1]){ 8 index=2*i+1; 9 max = array[2*i+1]; 10 } 11 if(2*i+2<length&&max<array[2*i+2]){ 12 index = 2*i+2; 13 max = array[2*i+2]; 14 } 15 if(index!=i){ 16 swap(array,index,i); 17 ReBuildMaxValue(array,length,index); 18 } 19 } 20 }
全部源代码:
1 #include "stdafx.h" 2 #include <iostream> 3 using namespace std; 4 5 //两个文位置的数据交换 6 void swap(int *array,int num1,int num2){ 7 int temp = *(array+num1); 8 *(array+num1) = *(array+num2); 9 *(array+num2) = temp; 10 } 11 12 //重构大根堆 13 void ReBuildMaxValue(int *array,int arraylength,int startIndex){ 14 int index=0; 15 //int j=0; 16 int max=0; 17 while((2*startIndex+1)<arraylength){ 18 index = startIndex; 19 max = array[index]; 20 if(max<(array[2*startIndex+1])){ 21 max=array[2*startIndex+1]; 22 index=2*startIndex+1; 23 } 24 if(2*startIndex+2<arraylength&&max<array[2*startIndex+2]){ 25 max=array[2*startIndex+2]; 26 index=2*startIndex+2; 27 } 28 if(index==startIndex){ 29 break; 30 } 31 swap(array,index,startIndex); 32 startIndex = index; 33 } 34 } 35 36 //构建大根堆 37 void createHeap(int *array,int length){ 38 int max=0; 39 int index=0; 40 for(int i=floor(length/2)-1;i>=0;i--){ 41 index = i; 42 max = array[i]; 43 if(max<array[2*i+1]){ 44 index=2*i+1; 45 max = array[2*i+1]; 46 } 47 if(2*i+2<length&&max<array[2*i+2]){ 48 index = 2*i+2; 49 max = array[2*i+2]; 50 } 51 if(index!=i){ 52 swap(array,index,i); 53 ReBuildMaxValue(array,length,index); 54 } 55 } 56 } 57 58 //堆排序 59 void heapSort(int *array,int arraylength){ 60 createHeap(array,10); 61 for(int i=arraylength-1;i>0;i--){ 62 swap(array,i,0); 63 ReBuildMaxValue(array,i,0); 64 } 65 } 66 67 int main(int argc, _TCHAR* argv[]) 68 { 69 int values[10]={5,4,17,13,15,12,10,7,11,9}; 70 heapSort(values,10); 71 for(int i=0;i<10;i++){ 72 cout<<*(values+i)<<endl; 73 } 74 return 0; 75 }