从排序开始(二) 希尔排序
希尔排序,是对直接插入排序的改进版本,又称增量缩小排序,实质上是一种分组插入排序。
基本思想是 先取第一个增量step,以该序列内所有下标相差 step 的元素作为一组,如 array[0], array[0 + step], array[0 + step*2].....作为一组,array[1], array[1 + step], array[1 + step*2]....作为一组,然后对这些分组分别进行直接插入排序,然后减小增量,重复进行上面操作,到最后 step = 1,这时序列已基本有序,对数组再次进行直接插入排序,这种情况下的直接插入排序复杂度为 O(n),而且保证了最后的结果是有序数列。
希尔排序的复杂度比较复杂,主要跟步长的选择有关,大概是 O(n logn^2),一般认为就是介于 O(n^2) 和 O(n logn) 之间。最好步长比较复杂,一般第一次取序列的一半,以后每次减半,直到步长为1。
对于希尔排序为什么明显优于直接插入排序,让我们看看维基:“希尔排序通过将比较的全部元素分为几个区域来提升插入排序的性能。这样可以让一个元素可以一次性地朝最终位置前进一大步。然后算法再取越来越小的步长进行排序,算法的最后一步就是普通的插入排序,但是到了这步,需排序的数据几乎是已排好的了(此时插入排序较快)。”“可能希尔排序最重要的地方在于当用较小步长排序后,以前用的较大步长仍然是有序的。比如,如果一个数列以步长5进行了排序然后再以步长3进行排序,那么该数列不仅是以步长3有序,而且是以步长5有序。如果不是这样,那么算法在迭代过程中会打乱以前的顺序,那就不会以如此短的时间完成排序了。”
复杂度:
最差时间复杂度:根据步长串行的不同而不同。 已知最好的 O(n logn^2)
最优时间复杂度:O(n)
平均时间复杂度:根据步长串行的不同而不同。
最差空间复杂度:O(n)
稳定性:不稳定
实现:
void shellSort(int data[], int n) { int i,j,step; for(step = n/2;step > 0;step /= 2) //步长,每次取一半 { for(i = step;i < n; ++i)//从step 开始,每一个元素插入到自己组内 { int key = data[i]; for(j = i - step;j >= 0 && data[j] > key;j -= step) //找到元素在自己组内的对应位置 data[j + step] = data[j]; data[j + step] = key; //为什么要 j + step 呢?直接插入排序还记得吧? } } }