《算法导论》第六章----堆排序练习（证明）（完整版）

《算法导论》学习记录目录

欢迎指出其中的错误和交流。

关于堆排序的具体介绍和C代码实现见该链接。

算导关于堆排序的练习主要是一些证明，可以帮助理解堆的特征。部分练习是图示过程，这些练习认真用笔过一次会很有收获。

1.在高度为h的堆中，最多和最少的元素个数是多少？

最多：底层全满；1 + 2^1 + 2^2 + ...... + 2^h，等比数列求和得2^(h+1) - 1

最少：底层只有一个节点；1 + 2^1 + 2^2 + ...... + 2^(h-1) + 1，等比数列求和得2^h - 1 + 1 = 2^h

2.证明：含n个元素的堆的高度为floor(lgn)

假设n个元素的堆的高度为h。由上题得2^h <= n <= 2^(h+1) - 1，因此h <= lgn < h+1。

根据floor 和 ceiling 函数的性质

见维基

得h = floor(lgn)

3.证明：在一个最大堆的某棵子树中，最大元素在该子树的根上。（看了答案才知道用反证法，居然想不到反证法，离散数学白看了。。。。。）

假设这个命题为错误的，存在一棵子树的最大元素不在该子树的根，最大元素的下标为m。

则下标为m的节点的值比其父节点的值大，但是最大堆的特性为某个节点的值最多和其父节点的值一样大，矛盾，因此假设为错误，命题正确。

4.证明：当用数组表示存储了m个元素的堆时，叶节点的下标是floor(n/2)+1, floor(n/2)+2,...n

刚开始打算通过公式证明最有一个叶节点的父节点为floor(n/2)，最后没能成功（数学太渣）。。。

根据二叉堆的性质：某节点下标为i（非根节点），其父节点的下标为floor(i/2)，因此最后一个叶节点的父节点的下标为floor(n/2)，所以从下标floor(n/2)+1开始到n都是叶节点。

5.写出最小堆中维持最小堆性质的操作（本来要求写伪代码）

 1 void min_heapify(int A[], int length, int i){
 2     int l = 2 * i;
 3     int r = 2 * i + 1;
 4     int smallest;
 5 
 6     if(l <= length && A[l] < A[i])
 7         smallest = l;
 8     else
 9         smallest = i;
10     if(r <= length && A[r] < A[smallest])
11         smallest = r;
12 
13     if(smallest != i){
14         int temp = A[smallest];
15         A[smallest] = A[i];
16         A[i] = temp;
17         min_heapify(A, length, smallest);
18     }
19 }

View Code

6.将max_heapify()函数的递归调用改为迭代结构，使效率提高。

 1 void max_heapify(int A[], int length, int i){
 2     int l, r;
 3     int largest, temp;
 4     while(i <= length){
 5         l = 2 * i;
 6         r = 2 * i + 1;
 7 
 8         if(l <= length && A[l] > A[i])
 9             largest = l;
10         else
11             largest = i;
12         if(r <= length && A[r] > A[largest])
13             largest = r;
14         
15         if(largest != i){
16             temp = A[largest];
17             A[largest] = A[i];
18             A[i] = temp;
19             i = largest;
20         }
21         else
22             break;
23     }
24 }

View Code

7.证明：对于一个大小为n的堆，max_heapify的最坏运行时间为Ω(lgn)。（提示：对于n个节点的堆，恰当地设置每个节点的值，使得从根节点到叶节点的路径上的每个节点都递归调用max_heapify）。

假设大小为n的堆的高度为h

首先如何使得从根节点到叶节点的路径上的每个节点都递归调用max_heapify？每次调用后的子树都符合子树的根节点小于左右儿子节点，则最初的根节点的值比所有左右儿子的值都小。接着要考虑的就是路径-----如何使得从根节点到叶节点的路径更长（最坏的情况）？“堆数据结构是一种数组对象，可以视为一棵完全二叉树。树的每一层都是填满的，最后一层除外（最后一层从一个节点的左子树开始填）”------《算导》原文。因此每次根节点与其左儿子节点交换，路径会是最长的，则所有左子树的值大于或等于右子树。这样设置，max_heapify会调用h次，所以运行时间为Θ(h)，即Θ(lgn)。根据大Θ符号的定义（链接为维基），详细见算导第三章----函数的增长，因此的得最坏运行时间为Ω(lgn)。

8.证明：在任一含n个元素的堆中，最多有ceiling(n / 2^(h+1))个高度为h的节点。

证明为算导的答案：（答案很详细）