C++ 数据结构 4:排序
1 基本概念
1.1 定义
排序是计算机内经常进行的一种操作,其目的是将一组“无序”的数据元素调整为“有序”的数据元素。
1.2 数学定义
假设含n个数据元素的序列为 { R1, R2, …, Rn}
,其相应的关键字序列为 { K1, K2, …, Kn}
这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系 : Kp1≤Kp2≤…≤Kpn
按此固有关系将上式记录序列重新排列为 { Rp1, Rp2, …,Rpn}
的操作称作 排序。
1.3 排序的稳定性
如果在序列中有两个数据元素 r[i]
和 r[j]
,它们的关键字 k[i] == k [j]
,且在排序之前,对象 r[i]
排在 r[j]
前面。如果在排序之后,对象 r[i]
仍在 r[j]
前面,则称这个排序方法是稳定的,否则称这个排序方法是不稳定的。
1.4 排序中的关键操作
-
比较:任意两个数据元素通过比较操作确定先后次序
-
交换:数据元素之间需要交换才能得到预期结果
1.5 内排序和外排序
-
内排序:整个排序过程不需要访问外存便能完成
-
外排序:待排序的数据元素数量很大,整个序列的排序过程不可能在内存中完成
1.6 总结
-
排序是数据元素从无序到有序的过程
-
排序具有稳定性,是选择排序算法的因素之一
-
比较和交换是排序的基本操作
-
多关键字排序与单关键字排序无本质区别
-
排序的时间性能是区分排序算法好坏的主要因素
2 选择排序
2.1 算法介绍
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素拍完。
2.2 基本思想
设数组为 a[0] ~ a[n-1]
-
初始时,数组全为无序区为
a[0] ~ a[n-1]
,令i = 0
-
在无序区
a[i] ~ a[n-1]
中选取一个最小的元素,将其与a[i]
交换,交换后a[0] ~ a[i]
就形成了一个有序区 -
i++
并 重复第 2 步,直到i == n-1
,排序完成。
简单来说:每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完。
2.3 算法实现
#include <stdio.h>
#include <stdlib.h>
//选择排序(升序排列)
void selectionSort(int *array, int len)
{
int min = 0; // 指向最小的元素的位置
int i = -1;
int j = -1;
int k = -1;
// 外层循环
for (i = 0; i < len - 1; ++i)
{
min = i;
// 内存循环
for (j = i + 1; j < len; ++j)
{
// 判断
if (array[min] > array[j])
{
// 保存最小的元素的位置
min = j;
}
}
// 判断是否需要交换
if (min != i)
{
// 找到了新的最小值
// 交换
int tmp = array[min];
array[min] = array[i];
array[i] = tmp;
}
printf("第 i = %d 次,排序后的数组为:\n",i);
for (k = 0; k < len; ++k)
{
printf("%d\t", array[k]);
}
printf("\n");
}
}
#if 1
void main()
{
int i;
//定义整型数组
int array[] = { 12, 5, 33, 6, 10 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
//排序
selectionSort(array, len);
//遍历
printf("选择排序之后的序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
2.4 稳定性
-
选择排序是不稳定的排序方法
-
选择排序效率:\(O(n^2)\)
3 冒泡排序
3.1 算法介绍
冒泡排序算法的运作如下:
从后往前
-
比较相邻的元素。如果第一个比第二个大,就交换他们两个。
-
对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。在这一点,最后的元素应该会是最大的数。
-
针对所有的元素重复以上的步骤,除了最后一个。
-
持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
3.2 基本思想
设数组长度为 N
。
从后往前
-
比较相邻的前后两个数据,如果 前面数据大于后面的数据,就将两个数据交换
-
这样对数组的第
0
个数据到N-1
个数据进行一次遍历后,最大的一个数据就“升”到数组第N-1
个位置 -
N = N-1
,如果N
不为0
就重复前面两步,否则排序完成。
3.3 排序过程
3.4 算法实现
#include <stdio.h>
#include <stdlib.h>
//冒泡排序(升序)
void bubbleSort(int *array, int len)
{
int i = -1;
int j = -1;
int k = -1;
// 判断数组是否已排序好 0: 没有排好, 1: 已经排好
int flag = 0;
int tmp = -1;
for (i = len - 1; i > 0 && flag == 0; --i)
{
flag = 1; // 假设已经排序好
for (j = 0; j < i; ++j)
{
if (array[j] > array[j + 1])
{
tmp = array[j];
array[j] = array[j + 1];
array[j + 1] = tmp;
flag = 0; // 此段代码被执行,说明还没有排好
}
}
printf("i = %d ,排序后的数组为:\n",i);
for (k = 0; k < len; ++k)
{
printf("%d\t", array[k]);
}
printf("\n");
}
}
#if 1
void main()
{
int i;
//定义整型数组
int array[] = { 11, 8, 7, 6, 3 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
//排序
bubbleSort(array, len);
//遍历
printf("冒泡排序之后的序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
3.5 冒泡总结
-
冒泡排序是一种效率低下的排序方法,在数据规模很小时,可以采用。数据规模比较大时,最好用其它排序方法。
-
上述例子总对冒泡做了优化,添加了exchange作为标记,记录序列是否已经有序,减少循环次数。
3.6 稳定性
-
冒泡排序是一种稳定的排序算法
-
冒泡排序的效率:\(O(n^2)\)
4 插入排序
4.1 算法介绍
每次将一个待排序的记录,按其关键字大小插入到前面已经排好序的子序列中的适当位置,直到全部记录插入完成为止。
4.2 基本思想
设数组为 a[0] ~ a[n-1]
-
初始时,
a[0]
自成 1 个有序区,无序区为a[1] ~ a[n-1]
。令i = 1
-
将
a[i]
并入当前的有序区a[1] ~ a[i-1]
中形成a[0] ~ a[i]
的有序区间。 -
i++
并重复第 2 步直到i == n-1
。排序完成。
4.3 算法实现
#include <stdio.h>
#include <stdlib.h>
//插入排序算法(升序排列)
void insertionSort(int *array, int len)
{
int tmp = 0; // 存储基准数
int index = 0; // 坑的位置
int i = -1;
int j = -1;
int k = -1;
// 遍历无序序列
for (i = 1; i < len; ++i)
{
index = i;
tmp = array[i];
// 遍历有序序列(从后往前)
for (j = i - 1; j >= 0; --j)
{
// 基准数根有序序列中的元素比较
if (tmp < array[j])
{
// 有序序列元素后移
array[j + 1] = array[j];
// 坑的位置
index = j;
}
else
{
break;
}
}
// 填坑
array[index] = tmp;
printf("i = %d ,排序后的数组为:\n",i);
for (k = 0; k < len; ++k)
{
printf("%d\t", array[k]);
}
printf("\n");
}
}
#if 1
void main()
{
int i = -1;
//定义整型数组
int array[] = { 12, 5, 33, 6, 10 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
//排序
insertionSort(array, len);
//遍历
printf("插入排序之后的序列:");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
4.4 稳定性
-
插入排序是稳定的排序算法
-
插入排序效率:\(O(n^2)\)
5 希尔排序
5.1 算法介绍
希尔排序的实质就是分组插入排序,该方法又称缩小增量排序,因 DL.Shell 于 1959 年提出而得名。
5.2 基本思想
先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。
简单来说:
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个数组恰被分成一组,算法便终止。
5.3 排序过程
5.4 算法实现
#include <stdio.h>
#include <stdlib.h>
//希尔排序
void shellSort(int *array, int len)
{
// 步长
int gap = len;
int i = -1;
int j = -1;
int k = -1;
while (gap > 1)
{
// 步长递减公式
gap = gap / 3 + 1;
// 分组, 对每一组, 进行插入排序
for (i = 0; i < gap; ++i)
{
int tmp; // 基准数
int index; // 坑的位置
// 插入排序
// 无序序列
for (j = i + gap; j < len; j += gap)
{
tmp = array[j];
index = j;
// 有序序列(从后往前遍历)
for (k = j - gap; k >= 0; k -= gap)
{
if (tmp < array[k])
{
// 后移
array[k + gap] = array[k];
// 位置
index = k;
}
else
{
break;
}
}
// 填坑
array[index] = tmp;
}
}
}
}
#if 1
void main()
{
int i = -1;
//定义整型数组
int array[] = { 12, 5, 33, 6, 10 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
//排序
shellSort(array, len);
//遍历
printf("希尔排序之后的序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
5.5 关于希尔排序步长的说明
-
步长的计算公式可以自行制定,最后步长 == 1 即可。
-
通过大量测试得出的结论:
步长 = 步长 / 3 + 1
5.6 稳定性
-
希尔排序是不稳定的排序算法
-
希尔排序的效率:\(O(n*logn)\) ≈ \(O(1.3*n)\)
6 快速排序
6.1 算法介绍
快速排序是C.R.A.Hoare于1962年提出的一种 划分交换排序。它 采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。
6.2 基本思想
-
先从元素序列中取出一个数作为基准数(枢轴)
-
分区过程:将比这个数大的数全放在它的右边,小于或等于它的数全放在它的左边。(升序)
-
再对左右区间重复第 2 步,直到各个区间只有一个数
6.3 算法实现
#include <stdio.h>
#include <stdlib.h>
//快速排序
void quickSort(int s[], int l, int r)
{
if (l < r)
{
int i = l, j = r;
// 拿出第一个元素, 保存到x中,第一个位置成为一个坑
int x = s[l];
while (i < j)
{
// 从右向左找小于x的数
while (i < j && s[j] >= x)
{
//左移, 直到遇到小于等于x的数
j--;
}
if (i < j)
{
//将右侧找到的小于x的元素放入左侧坑中, 右侧出现一个坑
//左侧元素索引后移
s[i++] = s[j];
}
// 从左向右找大于等于x的数
while (i < j && s[i] < x)
{
//右移, 直到遇到大于x的数
i++;
}
if (i < j)
{
//将左侧找到的元素放入右侧坑中, 左侧出现一个坑
//右侧元素索引向前移动
s[j--] = s[i];
}
}
//此时 i=j,将保存在x中的数填入坑中
s[i] = x;
quickSort(s, l, i - 1); // 递归调用
quickSort(s, i + 1, r);
}
}
#if 1
void main()
{
int i = -1;
//定义整型数组
int array[] = { 12, 5, 33, 6, 10 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
//排序
quickSort(array, 0, len-1);
//遍历
printf("快速排序之后的序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
6.4 稳定性
-
快速排序是一种不稳定的排序算法
-
排序效率: \(O(n*logn)\)
7 归并排序
7.1 算法介绍
归并排序是 建立在归并操作上的一种有效的排序算法。该算法是 采用分治法(Divide and Conquer)的一个非常典型的应用。
7.2 基本思想
基本思路就是将数组分成二组A,B,如果这二组组内的数据都是有序的,那么就可以很方便的将这二组数据进行排序。
如何让这二组组内数据有序了?
可以将A,B 组各自再分成二组。依次类推,当分出来的小组只有一个数据时,可以认为这个小组组内已经达到了有序,然后再合并相邻的二个小组就可以了。这样通过先递归的分解数列,再合并数列就完成了归并排序。
7.3 归并的定义
将两个或两个以上的 有序序列合并成一个新的有序序列:有序序列 V[1] ~ V[m] 和 V[m+1]~ V[n] ---> V[1] ~ V[n]
,这种归并方法称为 2 路归并
7.4 如何合并两个有序序列
7.4.1 代码实现
// 将两个有序数列a[first...mid]和a[mid+1...last]合并。
void mergeArray(int a[], int first, int mid, int last, int temp[])
{
int leftStart = first; //左有序序列起点
int leftEnd = mid; //左有序序列终点
int rightStart = mid + 1; //右有序序列起点
int rightEnd = last; //右有序序列终点
int length = 0; //两个有序序列合并之后的有序序列长度
int i = leftStart, j = rightStart;
// 将两个有序序列中的元素合并到第三个有序序列中(a的左半部分和右半部分合并到temp中)
while (i <= leftEnd && j <= rightEnd)
{
// 按照从小到大的顺序放入到temp中
if (a[i] <= a[j])
{
temp[length++] = a[i++];
}
else
{
temp[length++] = a[j++];
}
}
// 如果左半部分还有元素, 直接放到temp中
while (i <= leftEnd)
{
temp[length++] = a[i++];
}
// 如果右半部分还有元素, 直接放到temp中
while (j <= rightEnd)
{
temp[length++] = a[j++];
}
// 将temp中排好的序列拷贝到a数组中
for (i = 0; i < length; i++)
{
// 只替换已排好序的那一部分
a[leftStart + i] = temp[i];
}
}
7.5 排序过程
7.6 算法实现
#include <stdio.h>
#include <stdlib.h>
// 将两个有序数列a[first...mid]和a[mid+1...last]合并。
void mergeArray(int a[], int first, int mid, int last, int temp[])
{
int leftStart = first; //左有序序列起点
int leftEnd = mid; //左有序序列终点
int rightStart = mid + 1; //右有序序列起点
int rightEnd = last; //右有序序列终点
int length = 0; //两个有序序列合并之后的有序序列长度
int i = leftStart, j = rightStart;
// 将两个有序序列中的元素合并到第三个有序序列中(a的左半部分和右半部分合并到temp中)
while (i <= leftEnd && j <= rightEnd)
{
// 按照从小到大的顺序放入到temp中
if (a[i] <= a[j])
{
temp[length++] = a[i++];
}
else
{
temp[length++] = a[j++];
}
}
// 如果左半部分还有元素, 直接放到temp中
while (i <= leftEnd)
{
temp[length++] = a[i++];
}
// 如果右半部分还有元素, 直接放到temp中
while (j <= rightEnd)
{
temp[length++] = a[j++];
}
// 将temp中排好的序列拷贝到a数组中
for (i = 0; i < length; i++)
{
// 只替换已排好序的那一部分
a[leftStart + i] = temp[i];
}
}
// 归并排序
void mergeSort(int a[], int first, int last, int temp[])
{
if (first < last)
{
// 找到数组的中间位置
int mid = (first + last) / 2;
// 左边有序
mergeSort(a, first, mid, temp);
// 右边有序
mergeSort(a, mid + 1, last, temp);
// 再将二个有序数列合并
mergeArray(a, first, mid, last, temp);
}
}
#if 1
void main()
{
int i = -1;
//定义整型数组
int array[] = { 12, 5, 33, 6, 10 };
//计算数组长度
int len = sizeof(array) / sizeof(int);
//创建合适大小的临时数组
int *p = (int*)malloc(sizeof(int) * len);
if (p == NULL)
{
return;
}
//遍历数组
printf("待排序数组序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
mergeSort(array, 0, len - 1, p);
free(p);
//遍历
printf("归并排序之后的序列: ");
for (i = 0; i < len; ++i)
{
printf("%d\t", array[i]);
}
printf("\n");
system("pause");
}
#endif
运行结果:
7.7 稳定性
-
归并排序是一种稳定的排序算法。
-
排序效率: \(O(n*logn)\)
8 总结
排序算法 | 平均时间复杂度 | 最坏时间复杂度 | 平均空间复杂度 | 稳定性 |
---|---|---|---|---|
选择排序 | \(O({n^2})\) | \(O({n^2})\) | \(O(1)\) | 不稳定 |
冒泡排序 | \(O({n^2})\) | \(O({n^2})\) | \(O(1)\) | 稳定 |
直接插入排序 | \(O({n^2})\) | \(O({n^2})\) | \(O(1)\) | 稳定 |
希尔排序 | \(O({nlogn})\) | \(O({n^2})\) | \(O({nlog_2n})\) | 不稳定 |
快速排序 | \(O({nlogn})\) | \(O({n^2})\) | \(O(1)\) | 不稳定 |
归并排序 | \(O({nlogn})\) | \(O({nlogn})\) | \(O(n)\) | 稳定 |