AcWing 787. 归并排序
归并排序介绍
归并排序是建立在归并操作上的一种有效,稳定的排序算法。
该算法是采用分治法(\(\text{Divide and Conquer}\))的一个非常典型的应用。
将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并排序思想
它的基本思想:归并排序,首先把一个数组中的元素,按照某一方法,先拆分了之后,按照一定的顺序各自排列,然后再归并到一起,使得归并后依然是有一定顺序的。
归并排序算法可以利用递归的思想或者迭代的思想去实现。首先我们先把一个无序的数组去拆分,然后利用一定的规则,去合并。类似于二叉树的结构。
归并排序流程
- 把长度为n的输入序列分成两个长度为 \(n \div 2\) 的子序列;
- 对这两个子序列分别采用归并排序;
- 将两个排序好的子序列合并成一个最终的排序序列。
具体实现?
第一步,划分子区间:每次递归的从中间把数据划分为左区间和右区间。原始区间为 \([start, end]\),\(start = 0\),\(end = len - 1\),减一是因为数组的下标从 \(0\) 开始。然后从中间元素划分,划分之后的左右区间分别为 \([start, (end - start + 1) \div 2 + start]\),右区间为 \([(end - start + 1) \div 2 + start + 1, end]\)。重复过程,直到每个子区间只有一个或者两个元素。
第二步,合并子区间:子区间划分好以后,分别对左右子区间进行排序,排好序之后,在递归的把左右子区间进行合并。
- 开辟一个数组 \(a\),存放 \(l\) 到 \(q\) 之间(也就是需要归并的左边数组)的元素;
- 开辟一个数组 \(b\),存放 \(q\) 到 \(r\) 之间(也就是需要归并的右边数组)的元素;
- \(a\) 与 \(b\) 中的数字逐个比较,把较小的先放在数组 \(A\) 中(从数组 \(a_0\) 开始存放,依次往后覆盖原来的数),然后较小的数组指针往后移动,指向下一位再和另外一个数组比较。
动图演示
算法稳定性与时间复杂度
归并排序稳定性
算法稳定性:假设在数列中存在 \(a_i = a_j\),若在排序之前,\(a_i\) 在 \(a_j\) 前面;并且排序之后,\(a_i\) 仍然在 \(a_j\) 前面,则这个排序算法是稳定的。
归并排序是 稳定 的算法。
归并排序时间复杂度
了解归并排序的应该都知道,归并排序的时间复杂度是 \(O(n \log n)\),且这个时间复杂度是稳定的,不随需要排序的序列不同而产生波动。那这个时间复杂度是如何得来的呢?我们可以这样分析,假设我们需要对一个包含n个数的序列使用归并排序,并且使用的是递归的实现方式,那么过程如下:
- 递归的第一层,将 \(n\) 个数划分为 \(2\) 个子区间,每个子区间的数字个数为 \(n \div 2\);
- 递归的第二层,将 \(n\) 个数划分为 \(4\) 个子区间,每个子区间的数字个数为 \(n \div 4\);
- 递归的第三层,将 \(n\) 个数划分为 \(8\) 个子区间,每个子区间的数字个数为 \(n \div 8\);
…… - 递归的第 \(\log n\) 层,将 \(n\) 个数划分为 \(n\) 个子区间,每个子区间的数字个数为 \(1\);
而归并排序的合并操作,则是从最底层开始(子区间为 \(1\) 的层),对相邻的两个子区间进行合并,过程如下:
- 在第 \(\log n\) 层,每个子区间的长度为 \(1\),共 \(n\) 个子区间,每相邻两个子区间进行合并,总共合并 \(n \div 2\) 次。\(n\) 个数字都会被遍历一次,所有这一层的总时间复杂度为 \(O(n)\);
…… - 在第二层,每个子区间长度为 \(n \div 4\),总共有 \(4\) 个子区间,每相邻两个子区间进行合并,总共合并 \(2\) 次。\(n\) 个数字都会被遍历一次,所以这一层的总时间复杂度为 \(O(n)\);
- 在第一层,每个子区间长度为 \(n \div 2\),总共有 \(2\) 个子区间,只需要合并一次。\(n\) 个数字都会被遍历一次,所以这一层的总时间复杂度为 \(O(n)\);
我们可以发现,对于每一层来说,在合并所有子区间的过程中,\(n\) 个元素都会被操作一次,所以每一层的时间复杂度都是 \(O(n)\)。而之前我们说过,归并排序划分子区间,将子区间划分为只剩 \(1\) 个元素,需要划分 \(\log n\) 次,共有 \(\log n\) 层,所以归并排序的时间复杂度就是 \(O(n \log n)\)。
归并序实现
#include <iostream>
#include <cstring>
#include <algorithm>
#include <cstdio>
#include <cmath>
using namespace std;
const int N = 100010;
int a[N], tmp[N]; //a是需要排序的数组,tmp是辅助数组
void merge_sort(int q[], int l, int r)
{
if (l >= r) return;
int mid = (l + r) >> 1;
//递归划分子区间
merge_sort(q, l, mid);
merge_sort(q, mid + 1, r);
int i = l, j = mid + 1, cnt = 0;
//合并子区间
while (i <= mid && j <= r)
{
//q[i]更小存q[i]
if (q[i] <= q[j]) tmp[cnt ++ ] = q[i ++ ]; //注意cnt和i要+1
//存q[j]
else tmp[cnt ++ ] = q[j ++ ]; //记得+1
}
while (i <= mid) tmp[cnt ++ ] = q[i ++ ]; //左边数组有剩余
while (j <= r) tmp[cnt ++ ] = q[j ++ ]; //右边数组有剩余
for (int i = l, j = 0; i <= r; i ++ , j ++ ) q[i] = tmp[j]; //更新q数组
}
int main()
{
int n;
scanf("%d", &n);
for (int i = 0; i < n; i ++ ) scanf("%d", &a[i]);
merge_sort(a, 0, n - 1);
for (int i = 0; i < n; i ++ ) printf("%d ", a[i]);
return 0;
}
本文来自博客园,作者:FXT1110011010OI,转载请注明原文链接:https://www.cnblogs.com/FXT1110011010OI/p/16415199.html