预备知识
堆排序
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。
堆
堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆(大根堆);或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆(小根堆)。如下图:
同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子
该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:
大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]
小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]
ok,了解了这些定义。接下来,我们来看看堆排序的基本思想及基本步骤:
堆排序基本思想及步骤
堆排序的基本思想是:将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了
步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。
a.假设给定无序序列结构如下
2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。
4.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。
这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。
此时,我们就将一个无需序列构造成了一个大顶堆。
步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
a.将堆顶元素9和末尾元素4进行交换
b.重新调整结构,使其继续满足堆定义
c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.
后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序
再简单总结下堆排序的基本思路:
a.将无需序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
b.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
c.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
import random def sift(li, root, last): """ 调整函数,找到此父节点下最大的值,并与此父节点交换 :param li: 待排序数组(列表) :param root: 待交换的父节点下标 :param last: 数组最大下标 :return: """ larger = root # larger存放3个点中较大的值的下标,初始定为根节点 i = 2*root + 1 # 左子节点 j = 2*root + 2 # 右子节点 if i <= last and li[i] > li[larger]: larger = i if j <= last and li[j] > li[larger]: larger = j if larger != root: li[larger], li[root] = li[root], li[larger] sift(li, larger, last) # 必须要把一个分支找到底,让这个分支满足堆的特性 def heap_sort(li): """ 堆排序逻辑 :param li: 待排序数组 :return: """ n = len(li) # 获取数组长度 for i in range(n // 2 - 1, -1, -1): # 倒序循环所有父节点,建堆 sift(li, i, n-1) # for i in range(n - 1, -1, -1): # i 是数组下标 li[0], li[i] = li[i], li[0] # 把找出来的最大值放到堆的末尾 sift(li, 0, i-1) # 因为之前已经是堆了,所以交换之后在进行一次调整就又回变成堆了 return li l = list(range(1000)) random.shuffle(l) print(l) x = heap_sort(l) print(x)