快速排序原理、复杂度分析及C语言实现

   

     本文作者华科小涛:@http://www.cnblogs.com/hust-ghtao/热烈的笑脸,参考《算法导论》,代码借用《剑指offer》

    快速排序是一种最坏情况时间复杂度为03的排序算法。虽然最坏情况的时间复杂度很差,在在实际应用中是最好的选择,平均性能很好:期望时间复杂度01,而且01隐含的常数因子非常小。另外,它还能够进行原排序,在虚拟环境中也能很好工作。基于随机抽样的快速排序算法,在输入元素互异的情况下,期望运行时间为CodeCogsEqn(6)

 

1.基本思想

     快速排序利用了分治策略。分治策略可以分为3个步骤:

  • 分解:将问题划分为一些子问题,子问题的形式与原问题一样,只是规模更小。
  • 解决:递归的求解出子问题。如果子问题的规模足够小,则停止递归,直接求解。
  • 合并:将子问题的解组合成原问题的解。

    对一个典型的子数组A[p..r]进行快速排序的分治过程如下:

  • 分解:数组A[p..r]被划分为两个(可能为空)子数组A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每一个元素都小于等于A[q],而A[q+1..r]中的每个元素都大于A[q]。其中计算下标q也是划分过程的一部分。
  • 解决:通过递归调用快速排序,对子数组A[p..q-1]和A[q+1..r]进行排序。
  • 合并:因为子数组都是原址排序的,所以不需要合并操作。

 

2.详细过程

    快速排序的伪代码如下:

      image ,为了排序数组A的全部元素,初始调用QUICKSORT(A, 1, A.length)。

    其中最关键的部分就是数组的划分PARTITION,它实现了对子数组A[p..r]的原址重排。伪代码如下:

      image。 

这里的PARTITION程序选择x=A[r]作为主元,并围绕着它来划分数组。

随着程序的增加,数组被划分成4个区域,如下图所示:

image

其中:

  • A[p..i]上的所有值都小于等于x;
  • A[i+1..j-1]区间的所有值都大于x;
  • A[j..r-1]是还未扫描的元素,可能属于任何一种情况;
  • A[r]=x。

指针 i 一直指向小值数组的最后一个元素,j指向大值数组末尾的下一个元素。

PARTITION的一次迭代过程中会出现两种情况:

(a)如果A[j]>x,需要做的只是将j值加1:

image

 

(b)A[j]<=x,则将i值加1,并交换A[i]和A[j],在将j值加1,使循环不变量保持不变。

image

在PARTITION的最后,将主元与最左的大于x的元素进行交换,就可以将主元移动到它在数组中的正确位置,并返回主元的新下标。

 

3.性能分析

    快速排序的运行时间依赖于划分是否平衡,而平衡与否又依赖于用于划分的元素。

3.1 最坏情况划分

    当划分产生的两个子问题分别包含了n-1个元素和0个元素,这是极不平衡的划分。假设算法的每一次递归都出现了这种不平衡的划分,算法运行时间的递归式可以表示为:

CodeCogsEqn

可以解得:CodeCogsEqn(1)

所以,如果在算法的每一层递归上,划分都是最大程度不平衡的,那么算法的时间复杂度为:CodeCogsEqn(2)

3.2 平均情况

    在最平衡的划分中,PARTITION得到的两个子问题的规模都不大于n/2。算法运行时间的递归式为:

CodeCogsEqn(3)

可以解得:

02(1)

另外,只要是划分是常数比例的,甚至好的和差(极不平衡)的划分交替出现时,快速排序算法和全是好的划分时一样,仍然是01

 

4.随机化版本

    在算法中引入随机性,使得算法对所有的输入都能获得较好的期望性能。

    从A[p..r]中随机选择一个元素作为主元。为了达到这一目的,首先将A[r]与从A[p..r]随机选择的元素交换。通过对序列p..r随机抽样保证主元素

x=A[r]是等概率从r-p+1个元素中选取的。

    下面是RANDOMIZED-PARTITION和RANDOMIZED-QUICKSORT的伪代码:

image

在使用RANDOMIZED-PARTITION,输入元素互异的情况下,快速排序算法的期望运行时间为CodeCogsEqn(6)

 

6.代码实现

RANDOMIZED-PARTITION:

   1: int Partition(int data[], int length, int start, int end)  
   2: {  
   3:     if (data == NULL||length<=0||start<0||end>=length)  
   4:     {  
   5:         throw new std::exception("Invalid Parameters");  
   6:     }  
   7:     int index = RandomInRange(start, end);  
   8:     Swap(&data[index], &data[end]);  
   9:   
  10:     int small = start - 1;  
  11:     for (index = start; index < end;++index)  
  12:     {  
  13:         if (data[index] < data[end])  
  14:         {  
  15:             ++small;  
  16:             if (small!=index)  
  17:             {  
  18:                 Swap(&data[index], &data[small]);  
  19:             }  
  20:         }  
  21:     }  
  22:     ++small;  
  23:     Swap(&data[small], &data[end]);  
  24:   
  25:     return small;  
  26: }  

QUICKSORT:

   1: void QuickSort(int data[], int length, int start, int end)  
   2: {  
   3:     if (start == end)  
   4:     {  
   5:         return;  
   6:     }  
   7:     int index = Partition(data, length, start, end);  
   8:     if (index >start)  
   9:     {  
  10:         QuickSort(data, length, start, index-1);  
  11:     }  
  12:     if (index<end)  
  13:     {  
  14:         QuickSort(data, length, index + 1, end);  
  15:     }  
  16: }  

捕获

posted @ 2014-11-27 17:12  华科小涛  阅读(2898)  评论(3编辑  收藏  举报