第六章节 优先队列/堆
一般发送到打印机的作业 放到队列中,但这并不一定是最好的做法 ,比如可能有一个作业很重要,可以先打印,这个时候,就可以用到优先队列。
另外,短的作业一般应该首先完成 ,因此,在运行的程序中,短的作业有更高的优先权。
一、模型
优先队列一定要有的两个操作:insert ,deleteMin(找到并删除最小的).
其中,insert相当于队列中的enqueue, deleteMin类似于队列中的dequeue.
二、一些简单的实现
有几种简单的办法可以实现
- 使用简单的链表
在表头以O(1)进行插入,遍历以O(N)删除最小的.或者使链表保存有序的状态,则insert 要O(N), 而deleteMin要O(1).
- 使用二权查找树
deleteMin/ insert复杂度都是 O(logN).但是使用插找树有些过份了,因为它还支持很多别的工作,此外,在删除的最坏的情况下,会有失去平衡等问题。
- 二叉堆
不需要用到链,支持最坏的情形时O(logN),且插入操作平均用时为常数时间。
三、二叉堆
对于优先队列的实现时,使用的很普遍。和二叉查找树一样,堆也有两个性质,结构性与堆序性。对堆的操作可能破坏其中的一个,因此,堆 的操作一定要
到堆的所有性质都满足才终止。
- 性质结构
堆是一个完全填满的二叉树。一个完全二叉树可以用数组表示。对一个位置i的元素,左儿子在2i,右儿子在2i+1.父亲在i/2取整数。因此我们不用使用链,而且遍历很简单。唯一的问题是
要先估计大小 。
一个堆结构由一个comparable对象数组与一个代表当前堆大小的整数组成。如下,是一个堆
package c6; public class BinaryHeap<AnyType extends Comparable<? super AnyType>> { private static final int DEFAULT_CAP=10 ; private int currentSize ; private AnyType [] array ; public BinaryHeap(){ } public BinaryHeap(int cap){ } public BinaryHeap(AnyType [] items){ currentSize = items.length ; array = (AnyType [])new Comparable[(currentSize+2)*11/10]; int i=1; for (AnyType item : items){ array[i++] = item ; } buildHeap() ; } /** * 平均2.6,也就是O(1),最坏insert最小的元素时发生,O(lgN) * @param x */ public void insert(AnyType x ){ if (currentSize== array.length-1) enlargeArray(array.length*2+1) ; //percolate up int hole = ++ currentSize ; for(; hole>1 && x.compareTo(array[hole/2])<0;hole/=2){ array[hole] = array[hole/2] ; } array[hole] =x ; } public AnyType findMin() throws Exception{ if (isEmpty()) throw new Exception() ; return array[1] ;//array[0]没有用? } /** * O(lgN)--最坏和平均都是,因为要percolateDown * @return * @throws Exception */ public AnyType deleteMin() throws Exception{ if (isEmpty()) throw new Exception(); AnyType minIten = findMin(); //将array[currentSize]移动到空穴,再将currentSize-1 array[1] = array[currentSize--] ; percolateDown(1) ; return minIten ; } public boolean isEmpty(){ return currentSize==0 ;//?是否有问题 } public void makeEmpty(){ } /** * 删除的时候用到 * @param hole 空穴,这里是用的堆最后的一个元素 */ private void percolateDown(int hole){ int child ; AnyType temp = array[hole] ; for (;2*hole<= currentSize;hole = child){ child = 2*hole; //有两儿子时(child!=currentSize),先出两个小的一个 if (child!= currentSize && array[child+1].compareTo(array[child])<0){ child++ ; } //空穴往下滤 if (array[child].compareTo(temp)<0){ array[hole] = array[child] ; }else { break ; } } array[hole] = temp ; } /** * O(N),这个操作从下而上,不能反 */ private void buildHeap(){ for (int i= currentSize/2 ;i>0;i--){ percolateDown(i); } } private void enlargeArray(int newSize){ } }
- 堆性质
一个堆中,对于每一个节点X, X的父亲的关键字小于或者等于X中的关键字。因此,最小的元素就在根处。
堆的基本操作
insert
在下一个可用的位置放一个空穴:
如果 X可以放在这个空穴中,则完成。
如果不可,将空穴的父节点放到 空穴中,这样空穴就上移,直到X能放入空穴为止。
这种操作是上滤。新的元素在堆中上滤直到找到正确的位置。
如果插入的是最小元素,则要上滤到根处,将用时O(logN),平均来看,性能好很多,插入一次只要2.6次比较。性能好很多。
deleteMin
找到最小元素是简单的,但是删除比较复杂。
当删除一个最小元素时,根处出现 一个空穴,由于现在堆少了一个元素,因此堆中的最后一个元素X要移动到一个地方。
如果X可以直接放到空穴中,删除完成 。
如果不可以,将空穴的两儿子中小的移动到空穴,这样空穴下滤一层,重复上过程直到X可放到空穴中。
因此 ,做法就是将X放到沿着根开始,有最小儿子的一条路径 上的一个正确 的路径上。
对于一个节点如果只有一个儿子,我们要进行附加的测试,
这种操作的最坏情况运行时间为O(logN),平均来说,也是O(logN).
其它操作
事实上一个堆所蕴含的有序信息很少,如果不对整个堆进行线性搜索,是没有办法找到任何特定的关键字的。
buildHeap操作
可以将N个元素insert到一个空堆中,每一个insert将花费O(1)的平均时间和O(logN)的最坏时间,因此整个过和将花费O(N)平均时间,而不是O(NlogN)最坏时间。这是一种特殊的指令,没有
别的操作干扰。
一般的算法 是将N项以任意的顺序放到树中,保持结构特性,然后再percolatedown (i),以构造一个堆序的树。
四、优先队列的使用
选择问题
从N个元素中找出第k个最大的元素。下面给出两个在 k=N/2时,最坏以O(NlogN)运行的算法 。
算法1
只考虑找到第k个最小的元素,将N个元素读入数组,进行buildHeap算法 ,最后,进行k次deleteMin,得到结果。使用的时间为
O(N+k*logN)。如果 k很大,则为O(klogN),如果 k=N/2则为O(NlogN).如k=N,则相当于给N个元素进行了排序。
算法2
我们维持一个大小为k的堆,根元素就是这个小集合中最小的,再读入一个新的元素,与根进行比较。(略)。
除了不能进行find操作,堆最大的缺点是将两个堆合并是一个很困难的操作。下面讨论几个可以支持以O(NlogN)的时间进行merge的数据结构。