(转载)那些年我们一起学过的“排序算法”
(转载)http://www.cnblogs.com/BeyondAnyTime/archive/2012/08/14/2638070.html
排序算法是经常使用的算法,在STL中也有一个比较牛X的快速排序(sort),但是我们不能只会调用sort呀!?作为一个好学的同学,我们要知道各种排序的内部是怎么实现滴~~~提到排序算法我们要知道两个经常提到的概念:
(1)排序算法的稳定性:所谓“稳定性”是指,在待排序数组出现的两个相同的元素,排序之后相对维持保持不变。比如:待排序数组为arr[] = {1,4,3,1},排序之后元素变为arr_new[] = {1,1,4,3},并且arr_new中的第一个是arr中的第一个1,arr_new中的第二个1是arr中的第二个1,这是我们就说这种排序时稳定的。
(2)原地排序:所谓原地排序是指,不申请多余的空间来辅助完成排序算法,而是在原来的待排序的数据之上直接进行比较,交换,移动等操作。
1.插入排序
算法原理:将待排序的数组分为:有序区 和 无序区。然后每次从无序区取出第一个数据插入到有序区的正确位置,最终完成排序。
算法代码:
#include <iostream> using namespace std; void insert_sort(int *arr,int n) { int i,j; for(i = 1 ; i < n ; ++i) { int tmp = arr[i]; j = i - 1; while( j >= 0 && arr[j] > tmp) { arr[j+1] = arr[j]; j--; } arr[j+1] = tmp; } } int main() { int arr[] = {2,4,1,3,5,8,7,6,8}; insert_sort(arr,9); for(int i = 0 ; i < 9 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:看代码可以知道这种排序算法的时间复杂度是O(n^2),并且插入排序时稳定的,属于原地排序。那么什么时候使用插入排序比较好呢?那就是当数组中的大部分数据已经有序时,使用插入排序算法的效率比较高,这种情况下,所需要进行的数据移动较少,而数据移动正式插入排序算法的主要步骤~~~~
2.冒泡排序
算法原理:冒泡排序是经过n-1趟子排序完成的,第 i 趟子排序从第1个数至第 n-i+1 个数,若第 i 个数比第 i+1 个数大,则交换这两个数,实际上这样经过 i 次子排序就使得 第1个数至第 n-i +1个数之间最大的数交换到了n-i+1 的位置上了。实际上冒泡排序时可以优化的,那就是当第 i 次子排序并没有发生元素的交换时,就说明数组已经排好序了,以后的子排序就不用做了。
算法代码:
#include <iostream> using namespace std; void swap(int &x,int &y) { x = x^y; y = x^y; x = x^y; } void bubble_sort(int *arr,int n) { int i,j; for(i = n - 1 ; i > 0 ; --i) { bool flag = true; for(j = 0 ; j < i ; ++j) { if(arr[j] > arr[j+1]) { flag = false; swap(arr[j],arr[j+1]); } } if(flag) //数组已经排好序没必要在继续进行其他子排序了 break; } } int main() { int arr[] = {2,1,4,3,8,7,5,6}; bubble_sort(arr,8); for(int i = 0 ; i < 8 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:冒泡排序算法的时间复杂度是O(n^2),同时冒泡排序也是稳定的,并且属于原地排序,排序的效率取决于逆序对的多少。采用一点小优化也加速了冒泡排序。
3.选择排序
算法原理:所谓选择排序经过 n-1 次选择,当进行第 i 次选择时,是从第1个元素到第 n-i+1 的元素中选择最大的元素和第 n-i+1 个位置的元素交换,这样做比如第1 次选择使得最大的元素到了数组的最后一个位置。注意哦,在选择排序中每次选择时只进行一次数据的交换。
算法代码:
#include <iostream> using namespace std; void swap(int &x,int &y) { int tmp = x; x = y; y = tmp; } void select_sort(int *arr,int n) { int i,j; for(i = n-1 ; i > 0 ; --i) { int tmp = 0; for(j = 1 ; j <= i ; ++j) { if(arr[j] >= arr[tmp])//这里的“=”是保证选择排序稳定的关键 { tmp = j; } } swap(arr[i],arr[tmp]); } } int main() { int arr[] = {2,1,4,3,8,7,5,6}; select_sort(arr,8); for(int i = 0 ; i < 8 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:选择排序的思路非常的简单,实现起来也不难。时间复杂度是O(n^2),选择排序也是稳定的排序,并且也是原地排序。选择排序的时间基本不受数据的影响,因为不管怎样都要进行n-1次选择排序。
4.归并排序
算法原理:归并排序的思想是分治,将一个带排序的数组分成两个较小的数组,然后分别进行排序,组后将两个排好序的较小的数组合并起来,就得到了原来数组的排序后的结果。应该注意的是这种将两个排好序的数组合并有一个较好的算法,时间复杂度是O(n1+n2)的。n1、n2分别是两个小数组的长度。
算法代码:
#include <iostream> using namespace std; void merge_sort(int *arr,int start,int end,int *temp) { if(end > start+1) { int mid = start + (end - start) / 2; merge_sort(arr,start,mid,temp); merge_sort(arr,mid,end,temp); int i = start , j = mid , k = start; while(i < mid || j < end) { if(j >= end || (i < mid && arr[i] <= arr[j])) { temp[k++] = arr[i++]; } else { temp[k++] = arr[j++]; } } for(i = start ; i < end ; ++i) { arr[i] = temp[i]; } } } int main() { int temp[8]; int arr[] = {2,1,4,3,8,7,5,6}; merge_sort(arr,0,8,temp); for(int i = 0 ; i < 8 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:归并排序时稳定的排序,但是不属于原地排序,因为用了额外的O(n)的空间,时间复杂度降到了O(n*log n),并且对任意的数组进行排序时间复杂度都能控制在O(n*logn)。
5.堆排序
算法原理:所谓的堆排序是利用完全二叉树的思想实现的。首先应该提到的是最大堆,在最大堆中(完全二叉树二叉树)中每个父节点都大于等于两个儿子节点的值,这时候很明显堆顶是元素的最大值,然后把堆顶元素和堆中最后一个元素(分层遍历的节点编号最大的元素)交换,这样最大值就落到了数组的arr[n-1]的位置,然后把前n-1元素继续按照上面的方式处理,如此进行n-1次就完成堆排序。
算法代码:
#include <iostream> using namespace std; void swap(int &x,int &y) { x = x + y; y = x - y; x = x - y; } void quick_sort(int *arr,int s,int e) { if(s+1 < e) { int tmp = arr[s]; int i = s+1; int j = e-1; while(i < j) { while(i <= j && arr[i] <= tmp) { i++; } while(i <= j && arr[j] >= tmp) { j--; } if(i < j) { swap(arr[i],arr[j]); } } swap(arr[s],arr[i-1]); quick_sort(arr,s,i-1); quick_sort(arr,i,e); } } int main() { int arr[] = {2,1,4,3,8,7,5,6}; quick_sort(arr,0,8); for(int i = 0 ; i < 8 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:堆排序是不稳定的排序,但是堆排序属于原地排序。时间复杂度是O(n*log n),并且不需要额外的辅助空间,也就是说堆排序是一种不错的排序算法哦~~~
6.快速排序
算法原理:快速排序时这样的一种排序,选取数组中的第一个元素arr[0]作为依据,遍历一遍数组后,使得数组中的第一个元素进入正确的位置,即在该位置左面的元素均小于等于arr[0],在该位置右面的元素均大于等于arr[0]。然后,在对该位置左面和右面的元素分别进行快速排序,如此一来完成整个数组的排序。
算法代码:
#include <iostream> using namespace std; void swap(int &x,int &y) { x = x + y; y = x - y; x = x - y; } void quick_sort(int *arr,int s,int e) { if(s+1 < e) { int tmp = arr[s]; int i = s+1; int j = e-1; while(i < j) { while(i <= j && arr[i] <= tmp) { i++; } while(i <= j && arr[j] >= tmp) { j--; } if(i < j) { swap(arr[i],arr[j]); } } swap(arr[s],arr[i-1]); quick_sort(arr,s,i-1); quick_sort(arr,i,e); } } int main() { int arr[] = {2,1,4,3,8,7,5,6}; quick_sort(arr,0,8); for(int i = 0 ; i < 8 ; ++i) { cout<<arr[i]<<" "; } cout<<endl; return 0; }
小结:首先还是说明快速排序时不稳定的,但是是原地排序,不需要额外的空间,时间复杂度是O(nlog n),实际上,这种把第一个元素作为依据元素只是快速排序的一种,STL中的sort内部实现是根据排序到了不同的阶段选用不同的排序算法。当数据量大是采用quick_sort排序,当分段递归到了数据量小于某个数值时,为避免quick_sort的递归调用带来的额外开销,就改用insert_sort 了;如果递归层次过深,还会考虑使用heap_sort 。
学习中的一点总结,欢迎拍砖哦^^