1. 堆的定义和性质
堆是一种特殊的数据结构,它是一颗完全二叉树,且满足以下性质:
- 堆中某个节点的值总是不大于或不小于其父节点的值。如果父节点的值不大于其子节点的值,这样的堆称为最小堆;如果父节点的值不小于其子节点的值,这样的堆称为最大堆。
- 堆可以用数组来存储,因为它是完全二叉树,所以可以利用数组的索引来快速访问任意节点。
- 设当前节点的索引为i,
- 则其父节点的索引为i/2(向下取整),
- 其左孩子的索引为2i,其右孩子的索引为2i+1
堆是一种高效的数据结构,它可以快速地找到最大值或最小值,并且进行插入和删除操作。堆的主要应用有:
- 优先队列:优先队列是一种抽象数据类型,它可以按照元素的优先级顺序出队。优先队列可以用堆来实现,每次出队时,取出堆顶元素,并调整堆的结构。
- 堆排序:堆排序是一种基于比较的排序算法,它利用堆的性质来对数组进行排序。堆排序分为两个步骤:建堆和排序。建堆是将一个无序数组调整成一个堆;排序是每次将堆顶元素与最后一个元素交换,并缩小堆的范围,直到只剩下一个元素。
2. 拓展知识点
2.1 堆为什么叫堆,
- 一种说法是,堆这个词来源于英文单词heap,heap的本意是一堆东西,可以想象成一堆沙子或者石头,它们是无序的,但是如果我们想要从中找到最大或者最小的一个,只需要从最上面开始找就可以了,不需要遍历整个堆。这和堆这种数据结构的特点很相似,它也是一种无序的集合,但是可以在O(1)时间内找到最大或者最小的元素。
2.2 堆和普通树的区别
堆和普通树的区别主要有以下几点:
- 堆是一种特殊的完全二叉树,它的每个节点都满足堆的性质,即父节点的值不大于或不小于其子节点的值。而普通树可以是任意形状的,没有这样的性质限制。
- 堆可以用数组来存储,因为它是完全二叉树,所以可以利用数组的索引来快速访问任意节点。而普通树一般需要用指针来存储,占用更多的空间,并且访问速度较慢。
- 堆的主要操作是插入和删除,它们都可以在O(logn)时间内完成,并且保持堆的性质。而普通树的操作可能更多样化,比如搜索,遍历,旋转等,它们的时间复杂度也不一定是O(logn)
- 堆的主要应用是优先队列和排序,它可以快速地找到最大值或最小值,并且进行插入和删除。而普通树的应用可能更广泛,比如搜索树,平衡树,字典树等,它们可以解决不同类型的问题
2.3 完全二叉树 是指什么
完全二叉树是一种特殊的二叉树,它的定义如下:
- 完全二叉树是一棵深度为k的有n个结点的二叉树,
- 对树中的结点按从上至下、从左到右的顺序进行编号,如果编号为i(1≤i≤n)的结点与满二叉树中编号为i的结点在二叉树中的位置相同,则这棵二叉树称为完全二叉树。
- 完全二叉树除了最后一层外,其它各层的结点数都达到最大个数,第k层所有的结点都连续集中在最左边
- 完全二叉树可以用数组来存储,利用数组的索引来快速访问任意节点
- 完全二叉树具有n个结点的深度为floor(log2n)+1,其中floor表示向下取整
2.4 堆和完全二叉树的区别
堆和完全二叉树的区别主要有以下几点:
- 堆是一种特殊的完全二叉树,它满足父节点的值总是不大于或不小于其子节点的值,称为堆序性。完全二叉树只要求除了最后一层外,其他层的节点都是满的,且最后一层的节点都靠左。
- 堆可以分为最大堆和最小堆,最大堆的父节点的值总是不小于其子节点的值,最小堆的父节点的值总是不大于其子节点的值。完全二叉树没有这样的分类。
- 堆可以用数组来表示,因为完全二叉树有一个性质:对于任意一个父节点的序号n来说(这里n从0算),它的子节点的序号一定是2n+1,2n+2。完全二叉树也可以用数组来表示,但不一定能保持堆序性。
- 堆可以用来实现优先级队列,也可以用来进行堆排序。优先级队列可以在O(log n)时间内插入或删除元素,并且O(1)时间内查询最大(或最小)元素。堆排序的基本思想是:首先建立一个堆,然后将堆顶元素与最后一个元素交换,然后将剩余的元素重新调整为堆,重复这个过程,直到所有元素有序。完全二叉树没有这样的应用。
2.5 大顶堆和小顶堆的应用场景
大顶堆和小顶堆的应用场景主要取决于我们想要从一组数据中快速地找到最大值或者最小值,或者是找到第k大或者第k小的值。一般来说,有以下几种常见的应用场景:
- 堆排序:堆排序是一种基于堆的排序算法,它的基本思想是:首先建立一个大顶堆或者小顶堆,然后将堆顶元素与最后一个元素交换,然后将剩余的元素重新调整为堆,重复这个过程,直到所有元素有序。这个算法可以在O(nlogn)时间内完成,并且只需要O(1)的额外空间。
- 优先级队列:优先级队列是一种数据结构,它可以让我们在任意时刻都能快速地找到优先级最高(或最低)的元素,并且可以在O(logn)时间内插入或删除元素。优先级队列可以用堆来实现,一般使用小顶堆表示优先级最高的元素在堆顶,或者使用大顶堆表示优先级最低的元素在堆顶。优先级队列有很多应用场景,比如定时任务轮询,合并有序小文件,Dijkstra算法等。
- Top K问题:Top K问题是指从一组数据中找出最大(或最小)的K个元素。这个问题可以用堆来解决,一般使用一个大小为K的小顶堆来维护最大的K个元素,或者使用一个大小为K的大顶堆来维护最小的K个元素。每次遇到一个新的元素,就和堆顶元素比较,如果比它大(或小),就替换掉它,并重新调整堆。这样可以在O(nlogk)时间内解决这个问题。
- 中位数和百分位数问题:中位数和百分位数问题是指从一组数据中找出中间位置(或某个百分比位置)的元素。这个问题也可以用堆来解决,一般使用一个大顶堆和一个小顶堆来维护数据的两个部分,使得两个堆的大小之差不超过1,并且大顶堆的所有元素都小于等于小顶堆的所有元素。每次遇到一个新的元素,就根据它和两个堆顶元素的大小关系,将它插入到合适的堆中,并且保持两个堆的平衡。这样可以在O(logn)时间内插入一个元素,并且在O(1)时间内找到中位数(或百分位数)。
如果你想了解更多关于大顶堆和小顶堆的应用场景,你可以参考以下链接:
- 1: 数据结构 - 堆的应用场景_堆的数据结构可以应用到什么地方_it_lihongmin的博客-CSDN博客
- 2: [大、小根堆应用总结一]堆排序的应用场景 - CSDN博客
- 3: 详解数据结构——堆 - 知乎
- : 大顶堆/小顶堆的构建以及排序的应用 - 知乎
- : 算法学习笔记(47): 二叉堆 - 知乎 - 知乎专栏
- : 数据结构之堆(Heap) - 知乎
3. 堆的基本操作
3.1 插入
插入操作是向堆中添加一个新元素,使得堆仍然保持其性质。插入操作的步骤如下:
- 将新元素放到数组末尾,即作为完全二叉树的最后一个叶子节点。
- 将新元素与其父节点比较,如果新元素小于(或大于)其父节点,则交换它们的位置。
- 重复上一步,直到新元素到达根节点或者不再小于(或大于)其父节点。
例如,下图展示了在一个最小堆中插入元素8的过程:
插入操作的时间复杂度为O(logn),其中n为堆中元素个数。
3.2 删除
删除操作是从堆中移除一个元素,通常是移除堆顶元素,即最小值或最大值。删除操作的步骤如下:
- 将数组末尾的元素替换到根节点,即作为完全二叉树的新根节点。
- 将新根节点与其左右孩子中较小(或较大)的一个比较,如果新根节点大于(或小于)其左右孩子中较小(或较大)的一个,则交换它们的位置。
- 重复上一步,直到新根节点到达叶子节点或者不再大于(或小于)其左右孩子中较小(或较大)的一个。
例如,下图展示了从一个最小堆中删除元素0(即堆顶元素)的过程:
删除操作的时间复杂度为O(logn),其中n为堆中元素个数。
3.3 建堆
建堆操作是将一个无序数组调整成一个堆,使得堆中的每个节点都满足堆的性质。建堆操作的步骤如下:
- 从最后一个非叶子节点开始,对每个节点执行下沉操作,即将该节点与其左右孩子中较小(或较大)的一个比较,如果该节点大于(或小于)其左右孩子中较小(或较大)的一个,则交换它们的位置,然后继续对交换后的位置执行下沉操作,直到该节点到达叶子节点或者不再大于(或小于)其左右孩子中较小(或较大)的一个。
- 重复上一步,直到遍历到根节点。
例如,下图展示了将一个无序数组[5, 3, 8, 4, 1, 2, 6, 7]调整成一个最小堆的过程:
建堆操作的时间复杂度为O(n),其中n为数组元素个数。
4. 堆的代码实现
堆的代码实现
下面给出了使用Java实现最小堆的代码示例:
// 定义堆类
public class MinHeap {
// 定义数组属性
private int[] array;
// 初始化堆
public MinHeap(int[] array) {
this.array = array;
this.buildHeap();
}
// 返回堆中元素个数
public int size() {
return array.length;
}
// 判断堆是否为空
public boolean isEmpty() {
return size() == 0;
}
// 返回父节点索引
public int parent(int i) {
return (i - 1) / 2;
}
// 返回左孩子索引
public int left(int i) {
return 2 * i + 1;
}
// 返回右孩子索引
public int right(int i) {
return 2 * i + 2;
}
// 下沉操作
public void sink(int i) {
int n = size();
while (left(i) < n) { // 如果有左孩子
int j = left(i); // j为左孩子索引
if (right(i) < n && array[right(i)] < array[j]) { // 如果有右孩子且右孩子小于左孩子
j = right(i); // j为右孩子索引
}
if (array[i] <= array[j]) { // 如果当前节点小于等于较小的孩子
break; // 停止下沉
}
swap(i, j); // 否则交换当前节点和较小的孩子
i = j; // 更新当前节点索引
}
}
// 上浮操作
public void swim(int i) {
while (i > 0 && array[i] < array[parent(i)]) { // 如果当前节点小于其父节点
swap(i, parent(i)); // 交换当前节点和父节点
i = parent(i); // 更新当前节点索引
}
}
// 建堆操作
public void buildHeap() {
for (int i = size() / 2 - 1; i >= 0; i--) { // 从最后一个非叶子节点开始
sink(i); // 对每个节点执行下沉操作
}
}
// 插入操作
public void insert(int x) {
int[] newArray = new int[size() + 1]; // 创建一个新的数组,长度比原数组多1
System.arraycopy(array, 0, newArray, 0, size()); // 将原数组的元素复制到新数组中
newArray[size()] = x; // 将新元素放到新数组末尾
array = newArray; // 更新数组属性为新数组
swim(size() - 1); // 对新元素执行上浮操作
}
// 删除操作
public int delete() {
if (isEmpty()) { // 如果堆为空,抛出异常
throw new RuntimeException("Heap is empty");
}
int min_value = array[0]; // 记录堆顶元素,即最小值
array[0] = array[size() - 1]; // 将数组末尾的元素替换到根节点
int[] newArray = new int[size() - 1]; // 创建一个新的数组,长度比原数组少1
System.arraycopy(array, 0, newArray, 0, size() - 1); // 将原数组除了最后一个元素外的其他元素复制到新数组中
array = newArray; // 更新数组属性为新数组
sink(0); // 对根节点执行下沉操作
return min_value; // 返回最小值
}
// 交换两个元素的位置的辅助方法
private void swap(int i, int j) {
int temp = array[i];
array[i] = array[j];
array[j] = temp;
}
}
堆的测试
下面给出了使用堆来实现优先队列和堆排序的测试代码:
// 测试优先队列
public static void testPriorityQueue() {
System.out.println("Testing priority queue...");
MinHeap heap = new MinHeap(new int[]{5, 3, 8, 4, 1, 2, 6, 7}); // 创建一个最小堆
System.out.println("The heap is: " + Arrays.toString(heap.array)); // 打印堆
heap.insert(0); // 插入一个新元素
System.out.println("After inserting 0, the heap is: " + Arrays.toString(heap.array)); // 打印堆
int min_value = heap.delete(); // 删除堆顶元素
System.out.println("After deleting the minimum value, the heap is: " + Arrays.toString(heap.array)); // 打印堆
System.out.println("The minimum value is: " + min_value); // 打印最小值
}
// 测试堆排序
public static void testHeapSort() {
System.out.println("Testing heap sort...");
int[] array = new int[]{5, 3, 8, 4, 1, 2, 6, 7}; // 创建一个无序数组
System.out.println("The original array is: " + Arrays.toString(array)); // 打印数组
MinHeap heap = new MinHeap(array); // 创建一个最小堆
int[] sorted_array = new int[array.length]; // 创建一个空数组用来存放排序后的元素
for (int i = 0; i < array.length; i++) { // 当堆不为空时
sorted_array[i] = heap.delete(); // 将堆顶元素加入到排序后的数组中,并删除堆顶元素
}
System.out.println("The sorted array is: " + Arrays.toString(sorted_array)); // 打印排序后的数组
}
// 主函数
public static void main(String[] args) {
testPriorityQueue(); // 测试优先队列
testHeapSort(); // 测试堆排序
}
运行结果如下:
Testing priority queue...
The heap is: [1, 3, 2, 4, 5, 8, 6, 7]
After inserting 0, the heap is: [0, 3, 1, 4, 5, 8, 6, 7, 2]
After deleting the minimum value, the heap is: [1, 3, 2, 4, 5, 8, 6, 7]
The minimum value is: 0
Testing heap sort...
The original array is: [5, 3, 8, 4, 1, 2, 6, 7]
The sorted array is: [1, 2, 3, 4, 5, 6, 7, 8]
5. 堆的总结
堆是一种非常有用的数据结构,它可以快速地找到最大值或最小值,并且进行插入和删除操作。堆的主要应用有优先队列和堆排序。堆可以用数组来存储,利用完全二叉树的性质来快速访问任意节点。堆的基本操作有插入、删除和建堆,它们的时间复杂度都是O(logn)或O(n)。使用Python实现了最小堆的代码,并且给出了测试示例。
如果你想了解更多关于堆的知识,你可以参考以下链接:
6. refer
- 数据结构基础——堆的概念、结构及应用 - CSDN博客
- 堆(数据结构)_百度百科
- 详解数据结构——堆 - 知乎
- 【堆】堆的定义以及堆排序_Felix_CY的博客-CSDN博客
- 【数据结构】【堆】堆的建立、插入和删除 - CSDN博客
- 算法学习笔记(47): 二叉堆 - 知乎 - 知乎专栏
- 堆和树有什么区别?堆为什么要叫堆,不叫树呢? - 知乎
- 堆(完全二叉树),满二叉树,满二叉树与完全二叉树的区别 …
- 算法与数据结构之最大/最小堆 - 知乎
- 堆和二叉堆_一碗面的博客-CSDN博客
- 什么是堆?什么是栈?他们之间有什么区别和联系? - 知乎
- 堆(数据结构)_百度百科
- 详解数据结构——堆 - 知乎
- 算法学习笔记(47): 二叉堆 - 知乎 - 知乎专栏
- 堆和二叉堆_一碗面的博客-CSDN博客
- 堆和树有什么区别?堆为什么要叫堆,不叫树呢? - 知乎
- 堆和树的区别_shelven丶的博客-CSDN博客
- 堆的基本存储 | 菜鸟教程
- 数据结构 - 堆(Heap) - 知乎
- 数据结构之堆(Heap) - 知乎
- 【堆】堆的定义以及堆排序_Felix_CY的博客-CSDN博客
- 详解数据结构——堆 - 知乎
- 关于堆结构的详解 - StoneGeek - 博客园
- 数据结构之优先队列(Priority Queue) - 知乎
- 堆的定义与基本操作接口:建堆、插入、删除、排序(C++实现)_c++ 数组 堆的插入_JunJie_1107的博客-CSDN博客
- 数据结构 - 堆的应用场景_堆的数据结构可以应用到什么地方_it_lihongmin的博客-CSDN博客
- [大、小根堆应用总结一]堆排序的应用场景 - CSDN博客
- 详解数据结构——堆 - 知乎
- 大顶堆/小顶堆的构建以及排序的应用 - 知乎
- 算法学习笔记(47)
- 二叉堆 - 知乎 - 知乎专栏
- 数据结构之堆(Heap) - 知乎