数据结构及算法基础--堆排序(Heap Sort)

我在讲解heapsort之前,我先讲解了priority queue,重点就在于heap排序使用了priority queue的思想。

前面我们很详细的讲解了priority queue的的流程,我们在进行heapsort的时候就会简单很多。

注意我们sink的过程将会是理解heapsort的重要过程。

 

heapsort主要分为两个步骤,1)堆的建造,2)向下排序。

这里,我相信书中的概述是最好的:

 

整个流程图如下:

 

性能分析:

1)时间复杂度:

堆排序的时间复杂度,主要在初始化堆过程和每次选取最大数后重新建堆的过程;

          初始化建堆过程时间:O(n)

        推算过程:

        首先要理解怎么计算这个堆化过程所消耗的时间,可以直接画图去理解;

        假设高度为k,则从倒数第二层右边的节点开始,这一层的节点都要执行子节点比较然后交换(如果顺序是对的就不用交换);倒数第三层呢,则会选择其子节点进行比较和交换,如果没交换就可以不用再执行下去了。如果交换了,那么又要选择一支子树进行比较和交换;

        那么总的时间计算为:s = 2^( i - 1 )  *  ( k - i );其中 i 表示第几层,2^( i - 1) 表示该层上有多少个元素,( k - i) 表示子树上要比较的次数,如果在最差的条件下,就是比较次数后还要交换;因为这个是常数,所以提出来后可以忽略;

        S = 2^(k-2) * 1 + 2^(k-3)*2.....+2*(k-2)+2^(0)*(k-1)  ===> 因为叶子层不用交换,所以i从 k-1 开始到 1;

        这个等式求解,我想高中已经会了:等式左右乘上2,然后和原来的等式相减,就变成了:

        S = 2^(k - 1) + 2^(k - 2) + 2^(k - 3) ..... + 2 - (k-1)

        除最后一项外,就是一个等比数列了,直接用求和公式:S = {  a1[ 1-  (q^n) ] }  / (1-q);

        S = 2^k -k -1;又因为k为完全二叉树的深度,所以 (2^k) <=  n < (2^k  -1 ),总之可以认为:k = logn (实际计算得到应该是 log(n+1) < k <= logn );

        综上所述得到:S = n - longn -1,所以时间复杂度为:O(n)

 

        更改堆元素后重建堆时间:O(nlogn)

        推算过程:

       1、循环  n -1 次,每次都是从根节点往下循环查找,所以每一次时间是 logn,总时间:logn(n-1) = nlogn  - logn ;

    

       综上所述:堆排序的时间复杂度为:O(nlogn)

2)空间复杂度

因为堆排序是就地排序,空间复杂度为常数:O(1)

 

3)稳定性

堆排序是不稳定的排序方法。

 

 

这里有两个非常重要的定理:

 

 

就此,我们也算将排序算法讲完了,当然又一些排序算法并没有进行分析,但是也已经足够我们运用和学习了,身下的排序算法也是相对简单并且容易编写的算法。在这里,各处各个算法的比较图:

posted @ 2017-11-05 05:27  霄十一郎  阅读(794)  评论(0编辑  收藏  举报