数据结构之堆

树结构的不同形态，堆、线段树、字段树、并查集，四种不同的树形数据结构。

1、优先队列，本身就是一种队列。普通队列，先进先出，后进后出。优先队列，出队顺序和入队顺序无关，和优先级有关，优先级高者先得，优先级高的先出队。

类别	入队	出队（拿出最大元素）
普通线性结构（数组、链表等）	O(1)，直接将新的元素扔进去。	O(n)，需要扫描一遍元素，找出其优先级最高的元素，拿出队列。对于数据结构来说，如果有一项操作是O(n)级别的，那么进行n个元素的操作，整个过程就会是n的平方的过程，相对来说，比较慢的。
顺序线性结构（维持线性结构的顺序，动态数组、链表等）	O(n)，入队操作，需要找到需要插入的线性结构的位置。	O(1)，只需要拿出队首或者队尾的元素即可。
堆	O(logn)，最差情况下	O(logn)，最差情况下

2、完全二叉树，把元素顺序排列成树的形状。当我们把元素一层一层的排列成二叉树的形状的时候，得到的这棵树就是完全二叉树。

　　二叉堆的性质，堆中某个节点的值总是不大于其父节点的值，就是根节点的元素是最大的元素，根节点的值总是大于等于其左右孩子的值。这样得到的堆称为最大堆，相应的可以定义最小堆。

3、最大堆，可以使用定义二分搜索树的Node类来实现堆，这里也可以使用数组，因为完全二叉树，就是一个一个节点按照顺序一层一层的码放出来，所以可以使用数组的方式来表示完全二叉树。

注意，此时将数组索引0位置空置出来了。如果不将索引为0位置空置出来，可以使用这样的计算方式，父节点的索引parent(i) = (i - 1) /2，左孩子节点的索引left child(i) = 2 * i + 1，右孩子节点的索引right child(i) = 2 * i + 2；

4、向堆中添加元素和Sift Up，从用户的角度来看是添加元素，从堆的角度来看，设计到一个非常基础的内部的操作，通常英文叫做Sift Up（堆中元素的上浮）。

堆中元素的上浮，最后的效果如下所示：

5、取出堆中的最大元素和Sift Down。最大堆，我们从堆中取出元素只取出堆顶的这个元素，也就是二叉树的根节点所在的这个元素，这个元素是堆中存储元素最大的元素，取出操作只能取出这个元素，而不能取出其他的元素，根节点很好访问，就是对于数组来说，索引为0这个位置的元素。

此时，在数组表示中，索引为0的位置存放就是16这个元素了，数组最后一个元素的位置也是16，此时将最后一个元素16删除掉，这样从元素的个数上减少了一，此时减少的元素就是堆顶的元素，此时数组表示满足完全二叉树的性质的。

此时，需要进行调整，这个调整的过程，调整的是堆顶根节点的元素16，我们需要将这个节点向下调，所以叫做Sift Down（数据的下沉），需要下沉的这个位置的元素，和它的左右孩子进行比较，选择它的两个孩子中最大的那个元素52，如果它的两个孩子中最大的那个元素52比它自己还大，它就和左右孩子中最大的进行交换位置，此时，交换完位置之后，此时的根节点的元素52比它左右孩子的元素都要大。

此时，交换完元素之后，对于16这个新的位置，它很有可能依然不满足堆的性质，它可能依然要进行下沉下去，这个过程继续进行。此时16的索引为1，来看它的左右孩子，最大的那个孩子的元素41比16大，所以他们两个交换位置，此时可以保证41这个节点它比左右孩子还要大。

此时，让元素41和元素16进行替换，效果如下所示:

此时，此时，交换完元素之后，对于16这个新的位置，它很有可能依然不满足堆的性质，它可能依然要进行下沉下去，这个过程继续进行。此时16的索引为4，来看它的左右孩子，此时只有左孩子，并且16大于左孩子15，所以此时，不用进行任何操作。下沉操作结束了，此时完成了从堆中取出一个元素，取出元素之后依然维持了堆的性质。

6、Heapify将任意数组整理成堆的形状，由于堆是一棵完全二叉树，所以可以使用数组来表示，此时，如何将任意数组整理成堆的形状。

此时，从最后一个非叶子节点22开始向前遍历，进行siftDown下沉操作，22和它的左右孩子进行比较，22比左孩子62小，就进行下沉。此时22已经是叶子节点了，下沉操作就结束了。

之后，看索引为3对应的节点13，找到13的左右孩子的最大值，然后13和左右孩子最大值41进行比较，13小于41，13和41交换位置，此时，13变成了叶子节点，无法进行下沉了，这次下沉操作结束。

此时，看索引为2所对应的节点19，找到19的左右孩子的最大值，然后19和左右孩子最大值28进行比较，19小于28，19和28交换位置，此时，19变成了叶子节点，无法进行下沉了，这次下沉操作结束。

此时，看索引为1所对应的节点17，找到17的左右孩子的最大值，然后17和左右孩子最大值62进行比较，17小于62，17和62交换位置，此时，17还有一个左孩子22，17和左孩子22进行比较，17小于22，所以17和22进行交换，此时17变成了叶子节点，无法进行下沉了，这次下沉操作结束。

此时，看索引为0所对应的节点15，找到15的左右孩子的最大值，然后15和左右孩子最大值62进行比较，15小于62，15和62交换位置。此时，15还有两个左右孩子，15和左右孩子最大值41进行比较，15小于41，所以15和41进行交换。此时，15还有两个左右孩子，15和左右孩子最大值30进行比较，15小于30，所以15和30进行交换，此时15变成了叶子节点，无法进行下沉了，这次下沉操作结束。

7、最大堆的实现代码，如下所示：

  1 package com.maxHeap;
  2 
  3 import com.company.Array;
  4 
  5 import java.util.Random;
  6 
  7 /**
  8  * 最大堆，由于规定了每个节点的值都要大于等于左右孩子节点的值，所以要具有可比较性
  9  */
 10 public class MaxHeap<E extends Comparable<E>> {
 11 
 12     // 动态数组
 13     public Array<E> data;
 14 
 15     // ctrl + f12查看方法，变量等等
 16     // fn + alt + insert 构造方法
 17 
 18     /**
 19      * 如果直到动态数组的大小，可以直接创建
 20      *
 21      * @param capacity
 22      */
 23     public MaxHeap(int capacity) {
 24         data = new Array<>(capacity);
 25     }
 26 
 27 
 28     /**
 29      * 传递的数组参数转换为堆的形状，放到data的数组中。
 30      * <p>
 31      * <p>
 32      * Heapify的算法复杂度，将n个元素逐个插入到一个空堆中，算法复杂度是O(nlogn)级别的。
 33      * <p>
 34      * <p>
 35      * 如果使用的是heapify的过程，算法复杂度是O(n)级别的。
 36      *
 37      * @param arr
 38      */
 39     public MaxHeap(E[] arr) {
 40         // 首先拷贝一份用户传递的数组元素，放入到动态数组中。
 41         // 根据传递的数组，生成一个新的动态数组
 42         data = new Array<>(arr);
 43         // 此时data已经存放了用户传递的arr数组元素的值
 44 
 45         // 从最后一个非叶子节点开始向前依次遍历，进行元素的下沉
 46         // 从最后一个非叶子节点开始，最后一个节点的索引的父亲节点的索引。
 47         for (int k = this.parent(arr.length - 1); k >= 0; k--) {
 48             this.siftDown(k);
 49         }
 50     }
 51 
 52     /**
 53      * 无参构造函数，如果不知道动态数组的大小，默认大小长度是10
 54      */
 55     public MaxHeap() {
 56         data = new Array<>();
 57     }
 58 
 59     /**
 60      * 返回堆中的元素个数
 61      *
 62      * @return
 63      */
 64     public int size() {
 65         return data.getSize();
 66     }
 67 
 68     /**
 69      * 返回一个布尔值，表示堆中是否为空
 70      *
 71      * @return
 72      */
 73     public boolean isEmpty() {
 74         return data.isEmpty();
 75     }
 76 
 77     /**
 78      * 返回完全二叉树的数组表示中，一个索引所表示的元素的父亲节点的索引
 79      *
 80      * @param index
 81      * @return
 82      */
 83     private int parent(int index) {
 84         if (index == 0) {
 85             throw new IllegalArgumentException("index-0 doesn't hava parent.");
 86         }
 87         return (index - 1) / 2;
 88     }
 89 
 90     /**
 91      * 返回完全二叉树的数组表示中，一个索引所表示的元素的左孩子节点的索引。
 92      *
 93      * @param index
 94      * @return
 95      */
 96     private int leftChild(int index) {
 97         return index * 2 + 1;
 98     }
 99 
100     /**
101      * 返回完全二叉树的数组表示中，一个索引所表示的元素的右孩子节点的索引。
102      *
103      * @param index
104      * @return
105      */
106     private int rightChild(int index) {
107         return index * 2 + 2;
108     }
109 
110 
111     /**
112      * 向堆中添加元素。时间复杂度是O(logn)
113      *
114      * @param e
115      */
116     public void add(E e) {
117         // 向动态数组中添加一个元素
118         data.addLast(e);
119 
120         // 开始维护堆的性质
121         // 参数是，希望上浮的那个元素所对应的索引是多少，即最后一个元素的索引
122         siftUp(data.getSize() - 1);
123     }
124 
125     /**
126      * 元素上浮过程
127      *
128      * @param k
129      */
130     private void siftUp(int k) {
131         // 首先，不能已经达到了根节点，所以k必须大于零的。
132         // 如果该节点的父亲节点小于当前节点就进行上浮操作
133         while (k > 0 && data.get(this.parent(k)).compareTo(data.get(k)) < 0) {
134             // 将当前节点所处的元素和父亲节点的元素进行比较
135             // 如果当前节点所处的元素大于父亲节点的元素的值，将它们进行交换，进行上浮的动作。
136             data.swap(k, this.parent(k));
137             // 此时，让该节点元素的父亲节点的索引赋值给当前元素，
138             // 下一轮循环的时候，可以看当前的k已经来到了新的位置，
139             // 对于新的位置，是不是依然不满足堆的性质，就是它在新的位置
140             // 上的父亲节点所在的元素还要大，还要大就进行交换，依次类推。
141             // 直到走到了索引为0或者该节点小于父亲节点的元素。
142             k = parent(k);
143         }
144     }
145 
146     /**
147      * 看堆中的最大元素
148      *
149      * @return
150      */
151     public E findMax() {
152         if (data.getSize() == 0) {
153             throw new IllegalArgumentException("Can not findMax when heap is empty.");
154         }
155         return data.get(0);
156     }
157 
158     /**
159      * 取出堆中最大元素。时间复杂度是O(logn)
160      *
161      * @return
162      */
163     public E extractMax() {
164         // 首先，保存堆中的最大元素，暂存最大元素
165         E ret = this.findMax();
166         // 将堆顶元素和最后一个元素交换位置
167         data.swap(0, data.getSize() - 1);
168         // 交换完位置之后，此时已经将堆顶的元素放到数组的末尾了，数组末尾元素放在了堆顶位置
169 
170         // 删除最大元素，删除处于数组末尾的堆顶元素
171         data.removeLast();
172 
173         // 开始进行元素的下沉，参数是索引位置为0
174         siftDown(0);
175 
176         // 将最大元素返回，然后将最大元素从堆中删除
177         return ret;
178     }
179 
180     /**
181      * @param k 索引K
182      */
183     private void siftDown(int k) {
184         // 循环遍历，什么时候结束呢，
185         // 最极端的情况，k这个位置所处的节点，已经没有孩子了，当下沉到叶子节点的时候就结束了，
186         // 即，如果对于k这个节点的左孩子所在的索引小于数组的长度的时候，
187         // 此时k的左孩子都已经越界了，肯定一个孩子都没有了，此时右孩子的索引比左孩子的索引大。
188         // 循环的意思是，如果左孩子小于数组长度，就一直循环，否则就终止循环。
189         while (leftChild(k) < data.getSize()) {
190             // 比较k这个节点和k的左右孩子中最大的那个节点，看看k和这个最大的节点到底那个比较大，
191             // 先找到k左右孩子中最大的节点。
192             // 左孩子肯定是存在的，因为leftChild(k)小于数组的长度。
193             int j = this.leftChild(k);
194             // 但是右孩子不一定存在，所以此时进行判断，j + 1就是k的右孩子所在的索引，
195             // 如果K的右孩子小于数组的长度，说明有右孩子。
196             // 如果k的右孩子大于k的左孩子
197             if (j + 1 < data.getSize() && data.get(j + 1).compareTo(data.get(j)) > 0) {
198                 // data[j]是leftChild和rightChild中的最大值
199                 // j自增。此时j存储的是右孩子所对应的索引了。
200                 // j++;
201                 j = rightChild(k);
202                 // 如果k没有右孩子，或者k的左孩子大于右孩子，那么j存储的就是左孩子所对应的索引。
203             }
204 
205 
206             // 此时，将k节点和左右孩子最大的节点进行比较，如果发现了就终止本次循环。
207             // 因为此时，父亲节点的值大于左右孩子的值了，下沉操作结束了。
208             if (data.get(k).compareTo(data.get(j)) >= 0) {
209                 break;
210             }
211 
212             // 否则，就开始交换k这个索引位置和j这个索引位置的值。
213             data.swap(k, j);
214             // 交换结束之后，将j的赋值给k。进行下一轮循环，对于新的一轮k来说，是否需要继续下沉。
215             k = j;
216         }
217 
218     }
219 
220 
221     /**
222      * 取出堆中的最大元素，并且替换成元素e。
223      * <p>
224      * <p>
225      * Replace是取出最大元素后，放入一个新元素。此时，堆中元素的总数未发生改变，
226      * 此时可以使用这样方法来实现，首先可以先extractMax，然后再add操作，
227      * 两次O(logn)的操作。但是呢，可以直接将堆顶元素替换以后Sift Down（元素进行下沉操作），
228      * 这样的话是一次O(logn)的操作。
229      *
230      * @param e
231      * @return
232      */
233     public E replace(E e) {
234         // 取出最大元素的值
235         E ret = findMax();
236         // 此时，将0索引位置的元素替换成e
237         data.set(0, e);
238         // 然后使用下沉元素，使得根节点元素符合堆的性质
239         siftDown(0);
240 
241         // 将最大元素的值返回
242         return ret;
243     }
244 
245 
246     /**
247      * 对使用heapify或者不使用的时候进行性能测试
248      * <p>
249      * 使用heapify的方式进行元素添加，或者自己将元素添加到空堆中。
250      *
251      * @param data
252      * @param isHeapify 是否使用heapify
253      * @return
254      */
255     private static double performanceTesting(Integer[] data, boolean isHeapify) {
256         // 创建一个变量存储开始时间
257         long startTime = System.nanoTime();
258 
259         // 创建一个变量
260         MaxHeap<Integer> maxHeap;
261         // 判断是否使用heapify
262         if (isHeapify) {
263             // true是使用heapify，此时将数组传入到构造函数中就实现了使用heapify方法
264             maxHeap = new MaxHeap<>(data);
265         } else {
266             // 创建一个maxHeap对象
267             maxHeap = new MaxHeap<>();
268             // 循环遍历，将所有的元素值都新增到堆中
269             for (int i = 0; i < data.length; i++) {
270                 maxHeap.add(data[i]);
271             }
272         }
273 
274         // 验证堆的正确性
275         // 创建一个一百万长度的数组arr
276         int[] arr = new int[data.length];
277         // 取出最大元素。此时是循环一百万次，是对堆进行了一遍排序，从大到小进行排序的。
278         for (int i = 0; i < data.length; i++) {
279             // 将堆中最大的元素依次放入到数组中
280             arr[i] = maxHeap.extractMax();
281         }
282 
283         // 循环判断，如果下一个元素的值小于这个元素，就抛出异常
284         // 即前一个数小于后一个数，此时不是降序的序列了。
285         for (int i = 1; i < data.length; i++) {
286             if (arr[i - 1] < arr[i]) {
287                 throw new IllegalArgumentException("Error");
288             }
289         }
290 
291         // 如果是降序数组，此时正常执行这句话
292         System.out.println("Test MaxHeap completed.");
293 
294         // 创建一个变量存储结束时间
295         long endTime = System.nanoTime();
296         // 将纳秒转换为秒返回即可
297         return (endTime - startTime) / 1000000000.0;
298     }
299 
300 
301     public static void main(String[] args) {
302 //        // 初始化一百万
303 //        int n = 1000000;
304 //        // 初始化堆
305 //        MaxHeap<Integer> maxHeap = new MaxHeap<>();
306 //        // 创建一个随机对象
307 //        Random random = new Random();
308 //        // 将一百万个随机数扔到堆中
309 //        for (int i = 0; i < n; i++) {
310 //            // 0-到Integet最大值
311 //            maxHeap.add(random.nextInt(Integer.MAX_VALUE));
312 //        }
313 //
314 //        // 创建一个一百万长度的数组arr
315 //        int[] arr = new int[n];
316 //        // 取出最大元素。此时是循环一百万次，是对堆进行了一遍排序，从大到小进行排序的。
317 //        for (int i = 0; i < n; i++) {
318 //            // 将堆中最大的元素依次放入到数组中
319 //            arr[i] = maxHeap.extractMax();
320 //        }
321 //
322 //        // 循环判断，如果下一个元素的值小于这个元素，就抛出异常
323 //        // 即前一个数小于后一个数，此时不是降序的序列了。
324 //        for (int i = 1; i < n; i++) {
325 //            if (arr[i - 1] < arr[i]) {
326 //                throw new IllegalArgumentException("Error");
327 //            }
328 //        }
329 //
330 //        System.out.println("Test MaxHeap completed.");
331 
332 
333         // 初始化一百万
334         int n = 1000000;
335         // 初始化数组
336         Integer[] data = new Integer[n];
337         // 创建一个随机对象
338         Random random = new Random();
339         // 将一百万个随机数扔到堆中
340         for (int i = 0; i < n; i++) {
341             // 0-到Integet最大值
342             data[i] = random.nextInt(Integer.MAX_VALUE);
343         }
344 
345         // 第一次使用的是一个一个元素新增到堆中
346         double time1 = MaxHeap.performanceTesting(data, false);
347         System.out.println("Without heapify time1 : " + time1);
348 
349         // 第二次使用heapify的方式将元素添加到堆中
350         double time2 = MaxHeap.performanceTesting(data, true);
351         System.out.println("with heapify time2 : " + time2);
352 
353     }
354 
355 }

posted on 2020-03-18 09:39 别先生阅读(340) 评论(0) 收藏举报

代码改变世界，你改变代码===>你改变世界。老铁，没毛病。Date：2017/11/22

爱生活，爱工作。

数据结构之堆