数组各种排序算法和复杂度分析
Java排序算法
1)分类:
- 插入排序(直接插入排序、希尔排序)
- 交换排序(冒泡排序、快速排序)
- 选择排序(直接选择排序、堆排序)
- 归并排序
- 分配排序(箱排序、基数排序)
所需辅助空间最多:归并排序
所需辅助空间最少:堆排序
平均速度最快:快速排序
不稳定:快速排序,希尔排序,堆排序。
2)选择排序算法的时候要考虑
- 数据的规模 、
- 数据的类型 、
- 数据已有的顺序。
- 一般来说,当数据规模较小时,应选择直接插入排序或冒泡排序。任何排序算法在数据量小时基本体现不出来差距。 考虑数据的类型,比如如果全部是正整数,那么考虑使用桶排序为最优。 考虑数据已有顺序,快排是一种不稳定的排序(当然可以改进),对于大部分排好的数据,快排会浪费大量不必要的步骤。数据量极小,而起已经基本排好序,冒泡是最佳选择。我们说快排好,是指大量随机数据下,快排效果最理想。而不是所有情况。
3)总结:
——按平均的时间性能来分:
- 时间复杂度为O(nlogn)的方法有:快速排序、堆排序和归并排序,其中以快速排序为最好;
- 时间复杂度为O(n2)的有:直接插入排序、起泡排序和简单选择排序,其中以直接插入为最好,特别是对那些对关键字近似有序的记录序列尤为如此;
- 时间复杂度为O(n)的排序方法只有,基数排序。 当待排记录序列按关键字顺序有序时,直接插入排序和起泡排序能达到O(n)的时间复杂度;而对于快速排序而言,这是最不好的情况,此时的时间性能蜕化为O(n2),因此是应该尽量避免的情况。简单选择排序、堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变。
——按平均的空间性能来分(指的是排序过程中所需的辅助空间大小):
- 所有的简单排序方法(包括:直接插入、起泡和简单选择)和堆排序的空间复杂度为O(1);
- 快速排序为O(logn ),为栈所需的辅助空间;
- 归并排序所需辅助空间最多,其空间复杂度为O(n );
- 链式基数排序需附设队列首尾指针,则空间复杂度为O(rd )。
——排序方法的稳定性能:
- 稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和 经过排序之后,没有改变。
- 当对多关键字的记录序列进行LSD方法排序时,必须采用稳定的排序方法。
- 对于不稳定的排序方法,只要能举出一个实例说明即可。
- 快速排序,希尔排序和堆排序是不稳定的排序方法。
各种排序算法Java版
/* * Copyright (c) 2005-2015 XXX Corporation. All rights reserved. * * Project Name: test * File Name: SortTest.java * Package Name: XXX * date: 2016年7月28日 * */ package dt; import java.util.Arrays; /** * ClassName: SortTest <br/> * Description: TODO ADD DESCRIPTION. <br/> * date: 2016年7月28日 上午8:25:39 <br/> * * @author danier */ public class SortTest { static int[] a = { 5,17,16, 7,10, 9, 18,4,15,14, 3, 1, 19,0, 20,6,13, 2, 12,8,11 }; /** * main: ADD DESCRIPTION. <br/> * 执行流程: (可选). <br/> * 使用方法: (可选). <br/> * 注意事项: (可选). <br/> * * @author danier * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub long begin = System.currentTimeMillis(); SortTest st = new SortTest(); st.bubbleSort(); st.selectSort(); st.insertSort(); st.halfInsertSort(); st.hillsort(); st.mergeSort(0, a.length - 1); st.quickSort(0, a.length - 1); long over = System.currentTimeMillis(); System.out.println("使用的时间为:" + (over - begin) + "毫秒"); System.out.print(Arrays.toString(st.a)); } // 复杂度分析:一共要比较 ((n-1)+(n-2)+...+3+2+1)=n*(n-1)/2次,所以时间复杂度是O(n^2) // 冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较, // 交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无聊地把他们俩交换一下的; // 如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换, // 所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。 public void bubbleSort() { for (int i = a.length - 1; i > 1; i--) { for (int j = 0; j < i; j++) { if (a[j] > a[j + 1]) swap(j, j + 1); } } } // 选择排序是不稳定算法,最好的情是已经排好顺序,只要比较n*(n-1)/2次即可, // 最坏情况是逆序排好的,那么还要移动O(n)次,由于是低阶故而不考虑不难得出选择排序的时间复杂度是O(n^2) // 比较拗口,举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法 public void selectSort() { for (int i = 0; i < a.length; i++) { int min = i; for (int j = i + 1; j < a.length; j++) { if (a[j] < a[min]) min = j; } swap(i, min); } } // 插入排序的思想是这样的,第一层for循环表示要循环n次,且每次循环要操作的主体是a[i],第二层循环是对 // a[i]的具体操作,是从原数祖第i个位置起,向前比较,所以插入排序的平均时间复杂度也是O(n^2). // 比较是从有序序列的末尾开始,也就是想要插入的元素和已经有序的最大者开始比起, // 如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相等的, // 那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变, // 从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。 void insertSort() { for (int i = 1; i < a.length; i++) { int temp = a[i], j = i; while (j > 0 && a[j - 1] > temp) { a[j] = a[j - 1]; j--; } a[j] = temp; } }
// 1) 最好情况:序列是升序排列,在这种情况下,需要进行的比较操作需(n-1)次。后移赋值操作为0次。即O(n)
// 2) 最坏情况:O(nlog2n)。
// 3) 渐进时间复杂度(平均时间复杂度):O(nlog2n)
// 希尔排序是不稳定的。因为在进行分组时,相同元素可能分到不同组中,改变相同元素的相对顺序
public void hillsort() {
int h = 1;
while (h < a.length / 3) {
h = h * 3 + 1;
}
while (h > 0) {
for (int i = 1; i < a.length; i++) {
int temp = a[i], j = i;
while (j > h - 1 && a[j - h] > temp) {
a[j] = a[j - h];
j -= h;
}
a[j] = temp;
}
h = (h - 1) / 3;
}
}
// 二分查找排序是稳定的,不会改变相同元素的相对顺序, // 1. 时间复杂度:O(n^2) // 二分查找插入位置,因为不是查找相等值,而是基于比较查插入合适的位置,所以必须查到最后一个元素才知道插入位置。 // 二分查找最坏时间复杂度:当2^X>=n时,查询结束,所以查询的次数就为x,而x等于log2n(以2为底,n的对数)。即O(log2n) // 所以,二分查找排序比较次数为:x=log2n // 二分查找插入排序耗时的操作有:比较 + 后移赋值。时间复杂度如下: // 1) 最好情况:查找的位置是有序区的最后一位后面一位,则无须进行后移赋值操作,其比较次数为:log2n 。即O(log2n) // 2) 最坏情况:查找的位置是有序区的第一个位置,则需要的比较次数为:log2n,需要的赋值操作次数为n(n-1)/2加上 (n-1) 次。即O(n^2) // 3) 渐进时间复杂度(平均时间复杂度):O(n^2) void halfInsertSort() { for (int i = 1; i < a.length; i++) { if (a[i] > a[i - 1]) { continue; } int temp = a[i], left = 0, right = i - 1; while (left <= right) { int mid = (left + right) / 2; if (a[mid] > temp) right = mid - 1; else left = mid + 1; } for (int j = i; j > left; j--) { a[j] = a[j - 1]; } a[left] = temp; } }
public void mergeSort(int left, int right) { if (left >= right) return; int mid = (left + right) / 2; mergeSort(left, mid); mergeSort(mid + 1, right); merge(left, mid, mid + 1, right); } private void merge(int lb, int le, int rb, int re) { int[] temp = new int[a.length]; int leftbegin = lb; int index = lb; while (lb <= le && rb <= re) { if (a[lb] < a[rb]) temp[index++] = a[lb++]; else temp[index++] = a[rb++]; } while (lb <= le) { temp[index++] = a[lb++]; } while (rb <= re) { temp[index++] = a[rb++]; } while (leftbegin <= re) { a[leftbegin] = temp[leftbegin]; leftbegin++; } }
1》归并排序的步骤如下:
Divide: 把长度为n的输入序列分成两个长度为n/2的子序列。
Conquer: 对这两个子序列分别采用归并排序。
Combine: 将两个排序好的子序列合并成一个最终的排序序列。
2》时间复杂度:
这是一个递推公式(Recurrence),我们需要消去等号右侧的T(n),把T(n)写成n的函数。其实符合一定条件的Recurrence的展开有数学公式可以套,这里我们略去严格的数学证明,只是从直观上看一下这个递推公式的结果。当n=1时可以设T(1)=c1,当n>1时可以设T(n)=2T(n/2)+c2n,我们取c1和c2中较大的一个设为c,把原来的公式改为:
这样计算出的结果应该是T(n)的上界。下面我们把T(n/2)展开成2T(n/4)+cn/2(下图中的(c)),然后再把T(n/4)进一步展开,直到最后全部变成T(1)=c(下图中的(d)):
把图(d)中所有的项加起来就是总的执行时间。这是一个树状结构,每一层的和都是cn,共有lgn+1层,因此总的执行时间是cnlgn+cn,相比nlgn来说,cn项可以忽略,因此T(n)的上界是Θ(nlgn)。
如果先前取c1和c2中较小的一个设为c,计算出的结果应该是T(n)的下界,然而推导过程一样,结果也是Θ(nlgn)。既然T(n)的上下界都是Θ(nlgn),显然T(n)就是Θ(nlgn)。
4)快速排序算法思想
基于分治的思想,是冒泡排序的改进型。首先在数组中选择一个基准点(该基准点的选取可能影响快速排序的效率,后面讲解选取的方法),然后分别从数组的两端扫描数组,设两个指示标志(lo指向起始位置,hi指向末尾),首先从后半部分开始,如果发现有元素比该基准点的值小,就交换lo和hi位置的值,然后从前半部分开始扫秒,发现有元素大于基准点的值,就交换lo和hi位置的值,如此往复循环,直到lo>=hi,然后把基准点的值放到hi这个位置。一次排序就完成了。以后采用递归的方式分别对前半部分和后半部分排序,当前半部分和后半部分均有序时该数组就自然有序了。
// 平均时间复杂度O(nlogn),最坏时间复杂度O(n*n),辅助空间O(logn)<每次都要分给一个额外空间,而总共有logn次> // 每次分成两段,那么分的次数就是logn了,每一次处理需要n次计算,那么时间复杂度就是nlogn了! // 根据平均情况来说是O(nlogn),因为在数据分布等概率的情况下对于单个数据来说在logn次移动后就会被放到正确的位置上了。 // 最坏是O(n^2).这种情况就是数组刚好的倒序,然后每次去中间元的时候都是取最大或者最小。 // 稳定性:不稳定。
public static int partition(int []array,int lo,int hi){
//左右中抽取3个点,按照升序排好,以左节点作为pivot
int mid=lo+(hi-lo)/2;
if(array[mid]>array[hi]){
swap(array[mid],array[hi]);
}
if(array[lo]>array[hi]){
swap(array[lo],array[hi]);
}
if(array[mid]>array[lo]){
swap(array[mid],array[lo]);
}
int key=array[lo]; //此时左节点lo值为pivotValue。后续准备放置到lo和hi重合的位置
while(lo<hi){
//从右开始找到比key值小的数据,写入lo
while(array[hi]>=key&&hi>lo){
hi--;
}
array[lo]=array[hi];
//从左开始找到比key值大的数据,写入hi
while(array[lo]<=key&&hi>lo){
lo++;
}
array[hi]=array[lo];
}
// lo和hi重合时候,将pivotValue放入。此时hi左面的数都小于pivotValue,右面数大于pivotValue
array[hi]=key;
return hi;
}
public static void swap(int a,int b){
int temp=a;
a=b;
b=temp;
}
public static void sort(int[] array,int lo ,int hi){
if(lo>=hi){
return ;
}
int index=partition(array,lo,hi);
sort(array,lo,index-1);
sort(array,index+1,hi);
}