数据结构与算法（十）——堆

一、概述

1、介绍

　　堆：是具有以下性质的完全二叉树，建堆的时间o(n)。
　　大顶堆：根结点 >= 左右孩子结点，左右孩子不要求。
　　小顶堆：根结点 <= 左右孩子结点，左右孩子不要求。

　　大顶堆：

　　小顶堆：

　　性质：由于堆是完全二叉树，对任意结点 i 左孩子是 2i + 1，右孩子是 2i + 2，则：
　　①大顶堆：arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]
　　②小顶堆：arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]
　　③最后一个非叶子结点：arr.length / 2 - 1

2、建堆过程

　　用数组 {4, 6, 8, 5, 9} 构建成一个大顶堆，从最后一个非叶子结点（6）开始倒着调整。如图：

二、堆排序

1、介绍

　　堆排序是利用堆这种数据结构而设计的一种排序算法，是一种不稳定的选择排序，它的最坏，最好，平均时间复杂度均为O(nlogn)。

2、思想

　　（1）将待排序数组构建成一个大顶堆，自然有，arr[0] = max{arr}。
　　（2）将堆顶元素（最大）与数组的末尾元素交换，此时末尾元素就是最大值。
　　（3）将剩余的 n - 1 个序列重新调整成一个大顶堆，这样就得到 n 个元素中的次大值。
　　（4）如此反复，便能得到一个有序序列了。

3、过程

4、代码

 1 // 堆排序
 2 public static void heapSort(int[] arr) {
 3     // 1.构建大顶堆
 4     for (int i = arr.length / 2 - 1; i >= 0; i--) {
 5         adjustHeap(arr, i, arr.length);
 6     }
 7 
 8     // 2.交换.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端.
 9     for (int i = arr.length - 1; i > 0; i--) {
10         swap(arr, 0, i);
11         adjustHeap(arr, 0, i);
12     }
13 }
14 
15 /**
16  * 调整堆，以 i 对应的非叶子结点的树调整为大（小）顶堆
17  *
18  * @param arr    待调整的数组
19  * @param i      待调整的非叶子结点（数组的下标）
20  * @param length 剩下的 length 个元素继续调整，每次length会逐渐减少
21  */
22 private static void adjustHeap(int[] arr, int i, int length) {
23     // k 是 i 的左孩子.存在
24     for (int k = 2 * i + 1; k < length; k = 2 * k + 1) {
25         // k+1 是 i 的右孩子.存在
26         if (k + 1 < length && arr[k] < arr[k + 1]) {
27             k++;
28         }
29 
30         if (arr[i] >= arr[k]) {
31             break;
32         }
33 
34         swap(arr, i, k);
35 
36         // 继续调整因交换引起的孩子结点不满足堆的情况
37         i = k;
38     }
39 }
40 
41 private static void swap(int[] arr, int i, int j) {
42     int temp = arr[i];
43     arr[i] = arr[j];
44     arr[j] = temp;
45 }

5、小结

　　堆排序升序排序：大顶堆
　　堆排序降序排序：小顶堆
　　堆排序的时间复杂度是o(nlogn)
　　堆排序的空间复杂度是o(1)
　　构建堆的时间复杂度是o(n)
　　堆排序是一种不稳定的排序算法
　　有一组数据（15,9,7,8,20,-1,7,4），用堆排序的筛选方式建立的初始堆为（-1,4,7,8,20,15,7,9）。
　　将数组（7,6,3,5,4,1,2）按照堆排序的方式升序排序，则第一轮排序结束后，数组顺序是（6,5,3,2,4,1,7）。
　　对于根元素为最小值的二叉堆。
　　　　插入结点的复杂度是o(logn)
　　　　删除最小元素的复杂度是o(logn)（删除之后需要调整堆）
　　　　查询最小元素的复杂度是o(1)
　　有 n 个元素的序列，若使用筛选法建堆，则从位置为n/2取下整的元素开始建堆。
　　哈弗曼树带权路径长度最短的树，路径上权值较大的结点离根较近。
　　当从一个最小堆中删除一个元素时，需要把堆尾元素填补到堆顶位置，然后再按条件把它逐层向下调整到合适位置。

三、堆的应用

1、PriorityQueue优先队列

　　介绍：队列是遵循先进先出模式的，但有时需要在队列中基于优先级处理对象。就需要对象具有可比性；PriorityQueue是非线程安全的，所以Java提供了PriorityBlockingQueue（实现BlockingQueue接口）用于Java多线程环境。
　　代码示例：应用

 1 // 优先队列
 2 public class PriorityQueueDemo {
 3     public static void main(String[] args) {
 4         Queue<Stu> priorityQueue = new PriorityQueue<>();
 5 
 6         // 随机添加 7 个对象到队列中
 7         Random rand = new Random();
 8         for (int i = 0; i < 7; i++) {
 9             int id = rand.nextInt(100);
10             priorityQueue.offer(new Stu(id, "Stu:" + id));
11         }
12 
13         // 出队列
14         while (!priorityQueue.isEmpty()) {
15             final Stu stu = priorityQueue.poll();
16             System.out.println(stu);
17         }
18     }
19 }
20 // 使对象具有可比性
21 class Stu implements Comparable<Stu> {
22     private int id;
23     private String name;
24 
25     public Stu(int id, String name) {
26         this.id = id;
27         this.name = name;
28     }
29 
30     public int getId() {
31         return id;
32     }
33 
34     public void setId(int id) {
35         this.id = id;
36     }
37 
38     public String getName() {
39         return name;
40     }
41 
42     public void setName(String name) {
43         this.name = name;
44     }
45 
46     @Override
47     public int compareTo(Stu o) {
48         return this.id - o.id;
49     }
50 
51     @Override
52     public String toString() {
53         return "Stu{" +
54                 "id=" + id +
55                 ", name='" + name + '\'' +
56                 '}';
57     }
58 }

　　底层实现原理：Java中 PriorityQueue 通过小顶堆实现。源码参看JDK源码。

2、top K

　　什么是 top K 问题？简单来说就是在一堆数据里面找到前 K 大（当然也可以是前 K 小）的数。
　　最直接的想法：先通过快排等算法将 n 个数排序，再取前 k 个。这种方式在数据量不大的时候可行，但固然不是最优的方法。比如在 1 亿个数中找前 10 大的数，将 1 亿个数都排序，未免有点浪费。
　　缺点：在海量数据下，很可能没办法一次性将数据全部加载入内存。

　　分布式思想处理海量数据：将数据分散在多台机器中，然后每台机器并行计算各自的 top K 数据，最后汇总，再计算得到最终的 top K 数据。

　　一台机器处理海量数据：堆排序。
　　思想：维护一个大小为 k 的小顶堆，从 i = k+1 开始遍历数组arr，如果 arr[i] > 堆顶元素，则用 arr[i] 替换堆顶元素，并重新调整堆使之为小顶堆。遍历完全部数据，堆里面就是top K。
　　直接使用优先队列 PriorityQueue 来实现一个小顶堆，求 top K 问题：

 1 // top K
 2 public List<Integer> solutionByHeap(int[] input, int k) {
 3     List<Integer> list = new ArrayList<>();
 4     if (k > input.length || k == 0) {
 5         return list;
 6     }
 7 
 8     Queue<Integer> queue = new PriorityQueue<>();
 9     for (int num : input) {
10         if (queue.size() < k) {
11             queue.offer(num);
12         } else if (queue.peek() != null && queue.peek() < num) {
13             // 堆顶元素出列
14             queue.poll();
15             queue.offer(num);
16         }
17     }
18 
19     while (!queue.isEmpty()) {
20         list.add(queue.poll());
21     }
22     return list;
23 }

posted @ 2021-05-10 14:26 Craftsman-L 阅读(359) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

匠心

心心专一艺，事事在一工，念念系一职！

数据结构与算法（十）——堆

一、概述

1、介绍

2、建堆过程

二、堆排序

1、介绍

2、思想

3、过程

4、代码

5、小结

三、堆的应用

1、PriorityQueue优先队列

2、top K

公告