数据结构之二叉堆、堆排序

前言

堆的创造者

很久以前排序算法的时间复杂度一直是O(n^2)，当时学术界充斥着“排序算法不可能突破O(n^2)”的声音，直到1959年，由D.L.Shell提出了一种排序算法，希尔排序（Shell Sort），才打破了这种不可能的声音，把排序算法的时间复杂度提升到了O(n^3/2)！

当科学家们知道这种"不可能"被突破之后，又相继有了更快的排序算法，“不可能超越O（n^2）”彻底成为了历史。

在1964年，没错，是55年前！堆排序这种奇思妙想的，十分精彩的，排序算法诞生了！时间复杂度为O(nlogn)，远甩O（n^2）

由Robert W. Floyd（罗伯特·弗洛伊德）和J.W.J. Williams（威廉姆斯）共同发明了著名的堆排序，同时也发明了“堆”这样的数据结构， Floyd在1978年获得了图灵奖！真是个狼人！！（比很人还要多一点）

有时候了解下历史，也是十分有趣的！虽然你可能会觉得并没什么卵用~

堆是什么？

之前第一次听到堆这个词的时候，感觉像是一堆什么东西，完全跟树连想不到一起，后来才知道，原来堆也是一颗二叉树，而且是完全二叉树

堆的性质：

堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树。

大顶堆

小顶堆

如何用数组表示堆？

我们可以把堆，存放在一个数组中，根据索引来获取节点，那么如何通过索引表示父子关系呢？
堆是一颗完全二叉树，所以满足如下条件

假如当前的节点索引为：k
父节点索引：(k-1) / 2
左孩子节点：2 * k + 1
右孩子节点：2 * k + 2

根据这个规律，我们就可以用索引来计算出父子节点的位置了。这样就能把堆存放在数组中使用，会更加节省内存。

堆排序算法

堆排序算法就是形成一个堆后，假如是大顶堆，堆顶肯定是最大的元素，那我们每次都把堆顶的最大元素拿走，然后把堆末尾的元素放到堆顶来，但是这个元素不一定是当前最大的，所以还要对这个元素在堆里进行比较，把最大的元素放到堆顶，再取出来。如此我们每次取出的都是剩余元素中最大的元素，就能得到一组从大到小有序的元素。下面我们来用大顶堆对一组数据进行堆排序计算。

数据为：[50, 10, 90, 30, 70, 40, 80, 60, 20]

算法分为两个部分

1.如何将一组无序的数据构建出一个初始的大顶堆？
2.在拿走堆顶元素之后，如何计算出新的堆顶元素？

首先我们要实现一个操作：如果一个节点的子节点比它更大，就交换位置，如果子节点还有子节点，就要继续比下去，直到末尾。这个操作我们称为：HeapOne

	public void HeapOne(List<int> list, int len, int s)
	{
		int temp, j;
		
		temp = list[s];//先把指定要下沉节点的值取出来
		
		for (j = (2 * s)+1; j < len; j = (j*2)+1)
		{
			if (j < (len - 1) && list[j] < list[j + 1])//看看左右两个子节点谁更大，就取谁
				++j;
			
			if (temp >= list[j])//子节点比父节点小，就不管
				break;

			list[s] = list[j];//先把子节点的值给父节点
			s = j;//继续从这个子节点往下比较下去
		}
		list[s] = temp;
	}

实现这个操作之后，就可以开始我们的第一个部分了，形成初始大顶堆。

从最后一个非叶子节点开始，对该节点进行HeapOne，一直从下往上，直到把所有的父节点都HeapOne了一遍，一个初始的大顶堆就形成了。

	public void HeapSort(List<int> list)
	{
		int i;
		for (i = (list.Count - 1) / 2; i >= 0; i--)//第一部分，形成一个初始大顶堆
		{
			HeapOne(list, list.Count, i);
		}

		for (i = list.Count -1; i > 0; i--)//每拿走一个元素，都重新计算新堆
		{
			int temp = list[0];
			list[0] = list[i];
			list[i] = temp;
			
			HeapOne(list, i, 0);
		}
	}

算法第二部分

我们把堆顶的元素取出，放到一个临时变量里存着。
然后把堆的最末尾元素取出来，放到堆顶。
把堆的长度-1（因为已经取出之前的堆顶元素了）
接着对刚刚这个从末尾放到堆顶的元素，进行HeapOne操作，让他跟子节点比较，把最大的元素交换到堆顶来，再次形成最大堆。

一直重复这个操作后，直到最后一个堆顶被取出，放到数组末尾，堆的长度也就为0了，我们的数组也就形成了一组从大到小的数列。

如此，堆排序就完成了

总结

堆排序性能比较稳定，时间复杂度包含初始堆+排序时重建堆为：O(nlogn)。
在游戏开发中也会经常使用到堆

比如Top K问题，从n个数据中，找出最大的前100个。
用堆来实现优先加载队列。
A星寻路算法中，可以用最小堆来对寻路的开放列表维护顺序，把f值最小的放在堆顶，每次取出堆顶后，再HeapOne一次就好了。比每次都对开放列表进行排序的性能高的多。

参考

百度百科-堆排序
《大话数据结构》-程杰

posted @ 2019-03-25 00:32 李嘉的博客阅读(900) 评论(0) 编辑收藏举报

刷新页面返回顶部

李嘉的博客

小不忍则卖大萌

数据结构之二叉堆、堆排序

前言

堆的创造者

堆是什么？

如何用数组表示堆？

堆排序算法

总结

参考

公告