【排序基础】6、插入排序法的改进与选择排序的效率比较
插入排序法的改进
简单记录-bobo老师的玩转算法系列–玩转算法 -排序基础
之前实现的插入排序性能差,遍历的同时在不断交换
而交换是比比较更加耗时的,
插入排序的改进
改进就是在循环内层中交换变成了赋值。
改进的插入排序设计思想
改进改进 插入排序 设计思想
不想之前的插入排序直接交换 ,先复制一份当前插入元素
当前的元素与当前元素之前的元素 ,进行比较, 小就往后挪,大就赋值。
如:8 6
6复制一份 6比8小,8后挪一个位置,序列成了 8 8。
然后在考虑6是不是放在前面一个位置了 ,此时6已经在第0个位置了,不用比较了,复制的6直接赋值给第0个位置。
再举例子:2 6 8 3 序列
开始3复制了一份
3比8小,8往后挪一位
2 6 8 8
3比6小,6往后挪一位
2 6 6 8
3比2大 3就应该放在第二个的位置了
2 3 6 8
小就往后挪,大就赋值。
插入排序一次又一次操作 ,改成了比较后就赋值。
这就是改进了插入排序,交换变赋值 ,减少了操作 。
一次交换 就是三个赋值 。
06-Insertion-Sort-Advance
改进的插入排序实现
SortTestHelper排序测试辅助类
package algo;
import java.lang.reflect.Method;
import java.lang.Class;
import java.util.Random;
public class SortTestHelper {
// SortTestHelper不允许产生任何实例
private SortTestHelper(){}
// 生成有n个元素的随机数组,每个元素的随机范围为[rangeL, rangeR]
public static Integer[] generateRandomArray(int n, int rangeL, int rangeR) {
assert rangeL <= rangeR;
Integer[] arr = new Integer[n];
for (int i = 0; i < n; i++)
arr[i] = new Integer((int)(Math.random() * (rangeR - rangeL + 1) + rangeL));
return arr;
}
// 生成一个近乎有序的数组
// 首先生成一个含有[0...n-1]的完全有序数组, 之后随机交换swapTimes对数据
// swapTimes定义了数组的无序程度:
// swapTimes == 0 时, 数组完全有序
// swapTimes 越大, 数组越趋向于无序
public static Integer[] generateNearlyOrderedArray(int n, int swapTimes){
Integer[] arr = new Integer[n];
for( int i = 0 ; i < n ; i ++ )
arr[i] = new Integer(i);
for( int i = 0 ; i < swapTimes ; i ++ ){
int a = (int)(Math.random() * n);
int b = (int)(Math.random() * n);
int t = arr[a];
arr[a] = arr[b];
arr[b] = t;
}
return arr;
}
// 打印arr数组的所有内容
public static void printArray(Object[] arr) {
for (int i = 0; i < arr.length; i++){
System.out.print( arr[i] );
System.out.print( ' ' );
}
System.out.println();
return;
}
// 判断arr数组是否有序
public static boolean isSorted(Comparable[] arr){
for( int i = 0 ; i < arr.length - 1 ; i ++ )
if( arr[i].compareTo(arr[i+1]) > 0 )
return false;
return true;
}
// 测试sortClassName所对应的排序算法排序arr数组所得到结果的正确性和算法运行时间
public static void testSort(String sortClassName, Comparable[] arr){
// 通过Java的反射机制,通过排序的类名,运行排序函数
try{
// 通过sortClassName获得排序函数的Class对象
Class sortClass = Class.forName(sortClassName);
// 通过排序函数的Class对象获得排序方法
Method sortMethod = sortClass.getMethod("sort",new Class[]{Comparable[].class});
// 排序参数只有一个,是可比较数组arr
Object[] params = new Object[]{arr};
long startTime = System.currentTimeMillis();
// 调用排序函数
sortMethod.invoke(null,params);
long endTime = System.currentTimeMillis();
assert isSorted( arr );
System.out.println( sortClass.getSimpleName()+ " : " + (endTime-startTime) + "ms" );
}
catch(Exception e){
e.printStackTrace();
}
}
}
InsertionSort
package algo;
import java.util.*;
public class InsertionSort{
// 我们的算法类不允许产生任何实例
private InsertionSort(){}
public static void sort(Comparable[] arr){
int n = arr.length;
for (int i = 0; i < n; i++) {
// 寻找元素arr[i]合适的插入位置
// 写法1
// for( int j = i ; j > 0 ; j -- )
// if( arr[j].compareTo( arr[j-1] ) < 0 )
// swap( arr, j , j-1 );
// else
// break;
// 写法2
// for( int j = i; j > 0 && arr[j].compareTo(arr[j-1]) < 0 ; j--)
// swap(arr, j, j-1);
// 写法3
// 寻找元素arr[i]合适的插入位置
Comparable e = arr[i];
int j = i;
for( ; j > 0 && arr[j-1].compareTo(e) > 0 ; j--)
arr[j] = arr[j-1];
arr[j] = e;
}
}
private static void swap(Object[] arr, int i, int j) {
Object t = arr[i];
arr[i] = arr[j];
arr[j] = t;
}
// 测试InsertionSort
public static void main(String[] args) {
int N = 20000;
Integer[] arr = SortTestHelper.generateRandomArray(N, 0, 100000);
SortTestHelper.testSort("algo.InsertionSort", arr);
return;
}
}
Result
D:\Environments\jdk-11.0.2\bin\java.exe -javaagent:D:\Java\ideaIU-2019.2.win\lib\idea_rt.jar=14229:D:\Java\ideaIU-2019.2.win\bin -Dfile.encoding=UTF-8 -classpath D:\IdeaProjects\imooc\Play-with-Algorithms\02-Sorting-Basic\out\production\06-Insertion-Sort-Advance algo.InsertionSort
InsertionSort : 1598ms
Process finished with exit code 0
此时插入排序比选择排序性能高了点
优化后,插入排序比选择排序性能略好。
插入排序改进后与选择排序效率比较
此时优化插入排序算法的比选择排序性能高了
改进插入排序,不交换改赋值, 同时提前中止,条件合适的位置就中止了。假设数组基本有序,就更快了。 大量重复元素也快点,但不明显。
插入排序在几乎近乎有序的数组效率是非常高的,甚至比 O(nlogn) 还要快,最好的情况下。
那就生成一个近乎有序的数组去测试 实现
// 生成一个近乎有序的数组
// 首先生成一个含有[0...n-1]的完全有序数组, 之后随机交换swapTimes对数据
// swapTimes定义了数组的无序程度:
// swapTimes == 0 时, 数组完全有序
// swapTimes 越大, 数组越趋向于无序
public static Integer[] generateNearlyOrderedArray(int n, int swapTimes){
Integer[] arr = new Integer[n];
for( int i = 0 ; i < n ; i ++ )
arr[i] = new Integer(i);
for( int i = 0 ; i < swapTimes ; i ++ ){
int a = (int)(Math.random() * n);
int b = (int)(Math.random() * n);
int t = arr[a];
arr[a] = arr[b];
arr[b] = t;
}
return arr;
}
效率比较
package algo;
import java.util.Arrays;
public class Main {
// 比较SelectionSort和InsertionSort两种排序算法的性能效率
// 优化后,插入排序比选择排序性能略好
// 对于有序性强的数组,插入排序远远优于选择排序
public static void main(String[] args) {
int N = 20000;
// 测试1 一般测试
System.out.println("Test for random array, size = " + N + " , random range [0, " + N + "]");
Integer[] arr1 = SortTestHelper.generateRandomArray(N, 0, N);
Integer[] arr2 = Arrays.copyOf(arr1, arr1.length);
SortTestHelper.testSort("algo.SelectionSort", arr1);
SortTestHelper.testSort("algo.InsertionSort", arr2);
System.out.println();
// 测试2 有序性更强的测试
System.out.println("Test for more ordered random array, size = " + N + " , random range [0,3]");
arr1 = SortTestHelper.generateRandomArray(N, 0, 3);
arr2 = Arrays.copyOf(arr1, arr1.length);
SortTestHelper.testSort("algo.SelectionSort", arr1);
SortTestHelper.testSort("algo.InsertionSort", arr2);
System.out.println();
// 测试3 测试近乎有序的数组
int swapTimes = 100;
System.out.println("Test for nearly ordered array, size = " + N + " , swap time = " + swapTimes);
arr1 = SortTestHelper.generateNearlyOrderedArray(N, swapTimes);
arr2 = Arrays.copyOf(arr1, arr1.length);
SortTestHelper.testSort("algo.SelectionSort", arr1);
SortTestHelper.testSort("algo.InsertionSort", arr2);
return;
}
}
测试结果
Result
D:\Environments\jdk-11.0.2\bin\java.exe -javaagent:D:\Java\ideaIU-2019.2.win\lib\idea_rt.jar=14259:D:\Java\ideaIU-2019.2.win\bin -Dfile.encoding=UTF-8 -classpath D:\IdeaProjects\imooc\Play-with-Algorithms\02-Sorting-Basic\out\production\06-Insertion-Sort-Advance algo.Main
Test for random array, size = 20000 , random range [0, 20000]
SelectionSort : 847ms
InsertionSort : 1171ms
Test for more ordered random array, size = 20000 , random range [0,3]
SelectionSort : 621ms
InsertionSort : 406ms
Test for nearly ordered array, size = 20000 , swap time = 100
SelectionSort : 349ms
InsertionSort : 9ms
Process finished with exit code 0
20000个数据 100次交换
对于一个近乎有序的数组 插入排序要远远优于选择排序。
甚至比 O(nlogn) 还要快,最好的情况下。
插入排序 是具有实际意义的。
很多时候我们处理的就是有序的数据,比如系统的日志 ,时间生成是有序的,但是 其中就几个无序的元素,这是使用插入排序将会性能更好。
当我们排序的内容是一个近乎的有序内容时,插入排序将变成一个将变成一个O(n)算法,也就是在内层循环,每一次都执行一下 ,就发现刚才的位置就是合适的位置。
也正是这个原因,插入排序也会在更加复杂的排序算法中,作为一个子过程来进行优化 。
O(n^2)算法
插入排序 Insertion Sort
选择排序法 - Selection Sort
冒泡排序 - Bubble Sort
排序基础 - Sorting Basic
选择排序法 - Selection Sort
插入排序 - Insertion Sort
冒泡排序 - Bubble Sort
希尔排序 - Shell Sort
排序基础 选择排序 插入排序 冒泡排序 希尔排序