排序算法 堆排序 HeapSort -- C语言实现
堆排序
堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法:
- 大顶堆:每个节点的值都大于或等于其子节点的值,在堆排序算法中用于升序排列;
- 小顶堆:每个节点的值都小于或等于其子节点的值,在堆排序算法中用于降序排列;
堆排序的平均时间复杂度为 Ο(nlogn)。
堆排序的好处:
- 最坏情况性能保证:
- 堆排序的时间复杂度在最坏情况下也是 O(n log n),这使得 Introsort 即使在处理最不利的输入数据时也能保持高效。
- 简单性:
- 堆排序算法相对简单,易于实现,尤其是在 C++ 标准库中已经提供了现成的函数,如
std::make_heap
和std::sort_heap
。
- 堆排序算法相对简单,易于实现,尤其是在 C++ 标准库中已经提供了现成的函数,如
- 无需额外存储空间:
- 堆排序是原地排序算法,除了几个辅助变量外不需要额外的存储空间。这使得它适用于内存受限的环境。
- 稳定性:
- 虽然堆排序本身不是稳定的排序算法,但在 Introsort 的上下文中,这并不是一个问题,因为快速排序本身也不稳定。
堆排序属于选择排序
算法步骤
- 创建一个堆 H[0……n-1];
- 把堆首(最大值)和堆尾互换;
- 把堆的尺寸缩小 1,并调用 shift_down(0),目的是把新的数组顶端数据调整到相应位置;
- 重复步骤 2,直到堆的尺寸为 1。
代码实现
void AdjustDown()
void HeapSort(int *a, int size)
{
assert(a);
// ---- 1. 向下调整算法建堆 ----
//时间复杂度O(n)
//升序:建大堆
int min_parent = (size-1-1)/2; //规律:左右孩子减1除2都是父亲
while (min_parent >= 0) {
AdjustDown(a,size,min_parent);
min_parent--;
}
// ---- 2. 选数 ----
//时间复杂度O(n*logN),n个数都要高度次调整
while (size > 1) //下标size-1>0 从后往前,当下标为0时已经有序,即下标末尾到1
{
//"删除"
Swap(&a[0], &a[size - 1]);
size--;
AdjustDown(a, size, 0);
}
}
AdjustDown.cc
//大堆版本
//默认升序,建大堆删除(放后面),得到就是升序,即把最大节点往下调 --> 大堆删除
void AdjustDown(int *a, int size, int parent) {
//定义一个孩子,默认左边最大
int child = parent * 2 + 1;
while (child < size ){ //孩子到叶子结束,等价于最小父亲了
//确定最大孩子,不要越界
if (child + 1 < size && a[child] < a[child + 1]) {
child = child + 1;
}
//孩子大于父亲,换
if (a[child] > a[parent]) {
std::swap(a[child], a[parent]);
//更新迭代
parent++;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
时间复杂度分析
/*
向下调整算法建堆时间复杂度计算
假设满二叉树树高度h
各层的节点数为
第一层 2 ^ 0 ------向下调整h-1次
第二层 2 ^ 1 ------向下调整h-2次
第三层 2 ^ 2 ------向下调整h-3次
... ...
第h - 1层 2 ^ (h - 2) ------向下调整1次
第h层 2 ^ (h - 1)
向下调整算法建堆是从最小父亲开始,即第h-1层的最后一个节点 parent = (size-1-1)/2
最坏情况下所有节点需要执行的次数为
f(h) = 2^(h-2)*1 + 2^(h-3)*2 + ... + 2^1*(h-2) + 2^0*(h-1) 错位相减
2*f(h) = 2^(h-1)*1 + 2^(h-2)*2 + ... + 2^2*(h-2) + 2^1*(h-1)
作差、合并得f(h) = 2^h -h-1
其中 满二叉树节点数N = 2^h-1,即h = log(N+1) 代入得
f(N) = N - 1 - log(N+1) , 舍去logN(数量级)
所以O(n) = n
-------------------------------------------------------------------------------
而向上调整算法建堆时间复杂度比较吃亏,见图
假设满二叉树树高度h
各层的节点数为
第一层 2 ^ 0
第二层 2 ^ 1 ------向上调整1次
第三层 2 ^ 2 ------向上调整2次
... ...
第h - 1层 2 ^ (h - 2) ------向上调整h-2次
第h层 2 ^ (h - 1) ------向上调整h-1次
计算方法还是错位相减,由图显然可发现向上调整算法执行次数数量级明显提高
不再计算
O(n) = n*logN
总结:向下调整算法跳过最下层最多节点层,且从下层开始节点多执行次数少。快
向上调整算法从上开始从节点少往节点多执行次数成倍增加,前面的加起来都没最后一层多,慢
*/
记忆技巧:
无论是向上和向下调整算法,最好的用法都是从底开始;
如果是向上调整,功能是将底部的节点往上调整;
-
秉着从低开始是最好的原则,最好的用途就是在已有堆的基础上插入;
-
插入的节点一定是放在末尾的,即孩子节点,因此使用孩子作为参数;
如果是向下调整,功能是将上面的节点往下调整;
- 只有父结点才能向下调整,因此参数是父亲;
- 同理,建堆最好就是从底部开始,即从最小父亲开始建堆;
- 删除只能删顶节点,也只能使用向下调整;
本文来自博客园,作者:HJfjfK,原文链接:https://www.cnblogs.com/DSCL-ing/p/18345467