数据结构及算法基础--堆排序(Heap Sort)
我在讲解heapsort之前,我先讲解了priority queue,重点就在于heap排序使用了priority queue的思想。
前面我们很详细的讲解了priority queue的的流程,我们在进行heapsort的时候就会简单很多。
注意我们sink的过程将会是理解heapsort的重要过程。
heapsort主要分为两个步骤,1)堆的建造,2)向下排序。
这里,我相信书中的概述是最好的:
整个流程图如下:
性能分析:
1)时间复杂度:
堆排序的时间复杂度,主要在初始化堆过程和每次选取最大数后重新建堆的过程;
初始化建堆过程时间:O(n)
推算过程:
首先要理解怎么计算这个堆化过程所消耗的时间,可以直接画图去理解;
假设高度为k,则从倒数第二层右边的节点开始,这一层的节点都要执行子节点比较然后交换(如果顺序是对的就不用交换);倒数第三层呢,则会选择其子节点进行比较和交换,如果没交换就可以不用再执行下去了。如果交换了,那么又要选择一支子树进行比较和交换;
那么总的时间计算为:s = 2^( i - 1 ) * ( k - i );其中 i 表示第几层,2^( i - 1) 表示该层上有多少个元素,( k - i) 表示子树上要比较的次数,如果在最差的条件下,就是比较次数后还要交换;因为这个是常数,所以提出来后可以忽略;
S = 2^(k-2) * 1 + 2^(k-3)*2.....+2*(k-2)+2^(0)*(k-1) ===> 因为叶子层不用交换,所以i从 k-1 开始到 1;
这个等式求解,我想高中已经会了:等式左右乘上2,然后和原来的等式相减,就变成了:
S = 2^(k - 1) + 2^(k - 2) + 2^(k - 3) ..... + 2 - (k-1)
除最后一项外,就是一个等比数列了,直接用求和公式:S = { a1[ 1- (q^n) ] } / (1-q);
S = 2^k -k -1;又因为k为完全二叉树的深度,所以 (2^k) <= n < (2^k -1 ),总之可以认为:k = logn (实际计算得到应该是 log(n+1) < k <= logn );
综上所述得到:S = n - longn -1,所以时间复杂度为:O(n)
更改堆元素后重建堆时间:O(nlogn)
推算过程:
1、循环 n -1 次,每次都是从根节点往下循环查找,所以每一次时间是 logn,总时间:logn(n-1) = nlogn - logn ;
综上所述:堆排序的时间复杂度为:O(nlogn)
2)空间复杂度
因为堆排序是就地排序,空间复杂度为常数:O(1)
3)稳定性
堆排序是不稳定的排序方法。
这里有两个非常重要的定理:
就此,我们也算将排序算法讲完了,当然又一些排序算法并没有进行分析,但是也已经足够我们运用和学习了,身下的排序算法也是相对简单并且容易编写的算法。在这里,各处各个算法的比较图: