总结分享 | 排序算法总结一
选择排序
描述:
- 将数组分为两个子集,排序的和未排序的,每一轮从未排序的子集中选出最小的元素,放入排序子集
- 重复以上步骤,直到整个数组有序
算法实现
public static void selection(int [] arr){
for (int i = 0; i < arr.length - 1; i++) {
int min = i;
for (int j = i+1; j <arr.length ; j++) {
if (arr[j] < arr[min]){
min = j; //优化点
}
}
if (min != i){
int tem = arr[min];
arr[min] = arr[i];
arr[i] = tem;
}
System.out.println("第"+ (i+1) +"次排序: " + Arrays.toString(arr));
}
}
- 优化点:为减少交换次数,每一轮可以先找最小的索引,在每轮最后再交换元素
冒泡排序
描述:
- 依次比较数组中相邻两个元素大小,若 a[j] > a[j+1],则交换两个元素,两两都比较一遍称为一轮冒泡,结果是让最大的元素排至最后
- 重复以上步骤,直到整个数组有序
由此可知,
算法实现:
public static void BubbleSort(int[] a) {
for (int i = 0; i < a.length-1; i++) {
for (int j = 0; j < a.length-1; j++) {
if (a[j] > a[j+1]){
int tem = a[j];
a[j] = a[j+1];
a[j+1] = tem;
}
}
}
System.out.print("从小到大排序:"+Arrays.toString(arr));
}
进一步优化:
public static void bubble(int[] a) {
for (int j = 0; j < a.length - 1; j++) {
// 一轮冒泡
boolean swapped = false; // 是否发生了交换
for (int i = 0; i < a.length - 1 - j; i++) {
if (a[i] > a[i + 1]) {
int tem = a[i];
a[i] = a[i+1];
a[i+1] = tem;
swapped = true;
}
}
if (!swapped) {
break;
}
}
System.out.println(Arrays.toString(a));
}
- 优化点1:每经过一轮冒泡,内层循环就可以减少一次
- 优化点2:如果某一轮冒泡没有发生交换,则表示所有数据有序,可以结束外层循环
进一步优化:
public static void bubble_v2(int[] a) {
int n = a.length - 1;
while (true) {
int last = 0; // 表示最后一次交换索引位置
for (int i = 0; i < n; i++) {
System.out.println("比较次数" + i);
if (a[i] > a[i + 1]) {
Utils.swap(a, i, i + 1);
last = i;
}
}
n = last;
if (n == 0) {
break;
}
}
System.out.println("排序结果"+ Arrays.toString(a));
}
- 每轮冒泡时,最后一次交换索引可以作为下一轮冒泡的比较次数,如果这个值为零,表示整个数组有序,直接退出外层循环即可
与选择排序比较
- 二者平均时间复杂度都是 O(n^2)
- 选择排序一般要快于冒泡,因为其交换次数少
- 但如果集合有序度高,冒泡优于选择
- 冒泡属于稳定排序算法,而选择属于不稳定排序
- 稳定排序指,按对象中不同字段进行多次排序,不会打乱同值元素的顺序
- 不稳定排序则反之
插入排序
描述:
- 将数组分为两个区域,排序区域和未排序区域,每一轮从未排序区域中取出第一个元素,插入到排序区域(需保证顺序)
- 重复以上步骤,直到整个数组有序
[8],9,2,19,65,22,13,-1,99,-2 [8,9],2,19,65,22,13,-1,99,-2 [2,8,9],19,65,22,13,-1,99,-2 [2,8,9,19],65,22,13,-1,99,-2 ......
算法实现:
public static void insert(int [] arr){
for (int i = 1; i < arr.length; i++) {
//确定待插入的元素值
int sb = arr[i];
int index = i-1;
while( index >= 0 && arr[index]>sb ){
arr[index+1]=arr[index];
arr[index] = sb;
index--;
}
}
System.out.println(Arrays.toString(arr));
}
与选择排序比较
- 二者平均时间复杂度都是 O(n^2)
- 大部分情况下,插入都略优于选择
- 有序集合插入的时间复杂度为 O(n)
- 插入属于稳定排序算法,而选择属于不稳定排序
提示
插入排序的地位非常重要。小数据量排序,都会优先选择插入排序
快速排序
描述:
- 每一轮排序选择一个基准点(pivot)进行分区
- 让小于基准点的元素的进入一个分区,大于基准点的元素的进入另一个分区
- 当分区完成时,基准点元素的位置就是其最终位置
- 在子分区内重复以上过程,直至子分区元素个数少于等于 1,这体现的是分而治之的思想 (divide-and-conquer)
- 从以上描述可以看出,一个关键在于分区算法,常见的有洛穆托分区方案、双边循环分区方案、霍尔分区方案
单边循环快排(lomuto 洛穆托分区方案)
- 选择最右元素作为基准点元素
- j 指针负责找到比基准点小的元素,一旦找到则与 i 进行交换
- i 指针维护小于基准点元素的边界,也是每次交换的目标索引
- 最后基准点与 i 交换,i 即为分区位置
public static void quick(int[] a, int l, int h) {
if (l >= h) {
return;
}
int p = partition(a, l, h); // p 索引值
quick(a, l, p - 1); // 左边分区的范围确定
quick(a, p + 1, h); // 左边分区的范围确定
}
private static int partition(int[] a, int l, int h) {
int pv = a[h]; // 基准点元素
int i = l;
for (int j = l; j < h; j++) {
if (a[j] < pv) {
if (i != j) {
swap(a, i, j);
}
i++;
}
}
if (i != h) {
swap(a, h, i);
}
System.out.println(Arrays.toString(a) + " i=" + i);
// 返回值代表了基准点元素所在的正确索引,用它确定下一轮分区的边界
return i;
}
public static void swap(int[] array, int i, int j) {
int t = array[i];
array[i] = array[j];
array[j] = t;
}
双边循环快排(不完全等价于 hoare 霍尔分区方案)
- 选择最左元素作为基准点元素
- j 指针负责从右向左找比基准点小的元素,i 指针负责从左向右找比基准点大的元素,一旦找到二者交换,直至 i,j 相交
- 最后基准点与 i(此时 i 与 j 相等)交换,i 即为分区位置
要点
- 基准点在左边,并且要先 j 后 i
- while( i < j && a[j] > pv ) j--
- while ( i < j && a[i] <= pv ) i++
private static void quick(int[] a, int l, int h) {
if (l >= h) {
return;
}
int p = partition(a, l, h);
quick(a, l, p - 1);
quick(a, p + 1, h);
}
private static int partition(int[] a, int l, int h) {
int pv = a[l];
int i = l;
int j = h;
while (i < j) {
// j 从右找小的
while (i < j && a[j] > pv) {
j--;
}
// i 从左找大的
while (i < j && a[i] <= pv) {
i++;
}
swap(a, i, j);
}
swap(a, l, j);
System.out.println(Arrays.toString(a) + " j=" + j);
return j;
}
public static void swap(int[] array, int i, int j) {
int t = array[i];
array[i] = array[j];
array[j] = t;
}
快排特点
- 平均时间复杂度是 O(nlog_2 n ),最坏时间复杂度 O(n^2)
- 数据量较大时,优势非常明显
- 属于不稳定排序
洛穆托分区方案 vs 霍尔分区方案
- 霍尔的移动次数平均来讲比洛穆托少3倍
- https://qastack.cn/cs/11458/quicksort-partitioning-hoare-vs-lomuto