插入排序算法
插入排序(Insertion Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
历史记载:最早拥有排序概念的机器出现在1901至1904年间由Hollerith发明出使用基数排序法的分类机,此机器系统包括打孔,制表等功能,1908年分类机第一次应用于人口普查,并且在两年内完成了所有的普查数据和归档。 Hollerith在1896年创立的分类机公司的前身,为电脑制表记录公司(CTR)。他在电脑制表记录公司(CTR)曾担任顾问工程师,直到1921年退休。而电脑制表记录公司(CTR)在1924年正式改名为IBM
算法描述:
- 从第一个元素开始,该元素可以认为已经被排序
- 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 如果该元素(已排序)大于新元素,将该元素移到下一位置
- 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
- 将新元素插入到该位置后
- 重复步骤2~5
如果比较操作的代价比交换操作大的话,可以采用二分查找法来减少比较操作的数目。该算法可以认为是插入排序的一个变种,称为二分查找排序。
代码实现(c语言为例):
1 void insertion_sort(int * array, int first, int last)
2 {
3 int temp,i,j;
4 for (i = first + 1 ; i <= last ; i++) 5 { 6 temp = array[i]; 7 j = i-1; 8 //与已排序的数逐一比较,大于temp时,该数向后移 9 while ( j>=first && temp<array[j]) 10 //当first=0,j循环到-1时,由于[[短路求值]],不会运算array[-1] 11 { 12 array[j+1] = array[j]; //给排序的数腾位置 13 j--; 14 } 15 array[j+1] = temp; //被排序数放到正确的位置 16 } 17 }
其他编程语言,只有语法差别,思想相同,故不做介绍。
算法复杂度:
如果目标是把n个元素的序列升序排列,那么采用插入排序存在最好情况和最坏情况。最好情况就是,序列已经是升序排列了,在这种情况下,需要进行的比较操作需(n-1)次即可。最坏情况就是,序列是降序排列,那么此时需要进行的比较共有n(n-1)/2次。插入排序的赋值操作是比较操作的次数加上 (n-1)次。平均来说插入排序算法的时间复杂度为O(n^2)。因而,插入排序不适合对于数据量比较大的排序应用。但是,如果需要排序的数据量很小,例如,量级小于千,那么插入排序还是一个不错的选择。
参考文献:
- [97严] 严蔚敏,吴伟民,《数据结构C语言版》,清华大学出版社,1997年4月
- [99殷] 殷人昆,陶永雷,谢若阳,盛绪华,《数据结构(用面向对象方法与C++描述)》,清华大学出版社,1999年7月