排序算法堆排序 HeapSort -- C语言实现

堆排序

堆排序

堆排序（Heapsort）是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法：

大顶堆：每个节点的值都大于或等于其子节点的值，在堆排序算法中用于升序排列；
小顶堆：每个节点的值都小于或等于其子节点的值，在堆排序算法中用于降序排列；

堆排序的平均时间复杂度为 Ο(nlogn)。

堆排序的好处：

最坏情况性能保证：
- 堆排序的时间复杂度在最坏情况下也是 O(n log n)，这使得 Introsort 即使在处理最不利的输入数据时也能保持高效。
简单性：
- 堆排序算法相对简单，易于实现，尤其是在 C++ 标准库中已经提供了现成的函数，如 std::make_heap 和 std::sort_heap。
无需额外存储空间：
- 堆排序是原地排序算法，除了几个辅助变量外不需要额外的存储空间。这使得它适用于内存受限的环境。
稳定性：
- 虽然堆排序本身不是稳定的排序算法，但在 Introsort 的上下文中，这并不是一个问题，因为快速排序本身也不稳定。

堆排序属于选择排序

算法步骤

创建一个堆 H[0……n-1]；
把堆首（最大值）和堆尾互换；
把堆的尺寸缩小 1，并调用 shift_down(0)，目的是把新的数组顶端数据调整到相应位置；
重复步骤 2，直到堆的尺寸为 1。

代码实现

void AdjustDown()

void HeapSort(int *a, int size)
{
	assert(a);
	
	// ---- 1. 向下调整算法建堆  ----
	//时间复杂度O(n)

 //升序:建大堆
    int min_parent = (size-1-1)/2;  //规律:左右孩子减1除2都是父亲
    while (min_parent >= 0) {
        AdjustDown(a,size,min_parent);
        min_parent--;
    }


	
	// ---- 2. 选数 ----
	//时间复杂度O(n*logN),n个数都要高度次调整
    while (size > 1) //下标size-1>0 从后往前,当下标为0时已经有序,即下标末尾到1
	{
		//"删除"
		Swap(&a[0], &a[size - 1]);
		size--;
		AdjustDown(a, size, 0);  
	}

}

AdjustDown.cc

//大堆版本
//默认升序,建大堆删除(放后面),得到就是升序,即把最大节点往下调 --> 大堆删除
void AdjustDown(int *a, int size, int parent) {
    //定义一个孩子,默认左边最大
    int child = parent * 2 + 1;
    while (child < size ){ //孩子到叶子结束,等价于最小父亲了
        //确定最大孩子,不要越界
        if (child + 1 < size && a[child] < a[child + 1]) {  
            child = child + 1;
        }

        //孩子大于父亲,换
        if (a[child] > a[parent]) {
            std::swap(a[child], a[parent]);
            //更新迭代
            parent++;
            child = parent * 2 + 1;
        }
	else
		{
			break;
		}
	}
}

时间复杂度分析


/*
向下调整算法建堆时间复杂度计算
假设满二叉树树高度h
各层的节点数为
第一层 2 ^ 0               ------向下调整h-1次
第二层 2 ^ 1               ------向下调整h-2次
第三层 2 ^ 2               ------向下调整h-3次
...    ... 
第h - 1层  2 ^ (h - 2)     ------向下调整1次
第h层  2 ^ (h - 1)

向下调整算法建堆是从最小父亲开始，即第h-1层的最后一个节点 parent = (size-1-1)/2
最坏情况下所有节点需要执行的次数为
f(h) = 2^(h-2)*1 + 2^(h-3)*2 + ... + 2^1*(h-2) + 2^0*(h-1)    错位相减
2*f(h) = 2^(h-1)*1 + 2^(h-2)*2 + ... + 2^2*(h-2) + 2^1*(h-1)
作差、合并得f(h) = 2^h -h-1
其中 满二叉树节点数N = 2^h-1，即h = log(N+1) 代入得
f(N) = N - 1 - log(N+1)  ， 舍去logN(数量级)
所以O(n) = n

-------------------------------------------------------------------------------
而向上调整算法建堆时间复杂度比较吃亏，见图
假设满二叉树树高度h
各层的节点数为
第一层 2 ^ 0               
第二层 2 ^ 1               ------向上调整1次
第三层 2 ^ 2               ------向上调整2次
...    ...
第h - 1层  2 ^ (h - 2)     ------向上调整h-2次
第h层  2 ^ (h - 1)         ------向上调整h-1次
计算方法还是错位相减，由图显然可发现向上调整算法执行次数数量级明显提高
不再计算
O(n) = n*logN



总结：向下调整算法跳过最下层最多节点层，且从下层开始节点多执行次数少。快
	向上调整算法从上开始从节点少往节点多执行次数成倍增加，前面的加起来都没最后一层多，慢
*/

记忆技巧:

无论是向上和向下调整算法,最好的用法都是从底开始;

如果是向上调整,功能是将底部的节点往上调整;

秉着从低开始是最好的原则,最好的用途就是在已有堆的基础上插入;
插入的节点一定是放在末尾的,即孩子节点,因此使用孩子作为参数;

如果是向下调整,功能是将上面的节点往下调整;

只有父结点才能向下调整,因此参数是父亲;
同理,建堆最好就是从底部开始,即从最小父亲开始建堆;
删除只能删顶节点,也只能使用向下调整;

posted @ 2024-08-06 19:03 HJfjfK 阅读(259) 评论(0) 收藏举报

刷新页面返回顶部

排序算法 堆排序 HeapSort -- C语言实现

堆排序