关于快速排序的理解。

记得以前我研究生毕业找工作的时候，很多关于算法的东西，比如快速排序，都是死记硬背的。

这很容易就忘了。每每想自己写一个快速排序的时候，就很尴尬。

快速排序的本质是从数组中选一个参考值ref，比该参考值的大的，将其放在ref的右边，比ref小的放在左边，然后不断的对两边重复执行该动作

我们先列出来快速排序的步骤：

1.从数组中选一个参考值ref，比该参考值的大的，将其放在ref的右边，

　　上面的动作将数组划分为两部分:

　　A ref B

　　A是比ref小的数组元素集合，它仍然是数组，B是比ref大的元素集合，它也仍然是数组

2.在对ref左右两边的元素重复上述动作，直到A和B都只剩下一个元素，那么排序就算完成了。

重点是如何分别选出来两个集合A和B。算法导论里面把这个步骤叫做partition动作。

先把算法导论里面的伪代码贴出来，大家先看一下：

假设数组的范围是p--r

先看第一种ref的选择方法，即ref = a[r]

partition(a[], p, r)
{
　　i = p
　　j = p-1
　　ref = a[r]
    for(; i<r; i++)
　　{　　
        if(a[i]<ref)
　　　　{
　　　　　　j++
　　　　　　exchange(a[i], a[j])
　　　　}
　　}
　　exchange(a[r], a[j+1])
　　return j+1;
}

首先找一个参考值，ref = a[r]，为了简单起见，这里取最后一个作为参考值，实际上可以去任意一个值作为参考值。这个我们一会再说。

然后找定义两个游标，分别是i 和j。i=p， j=p-1。为什么要这么定义呢？原因是我们既然选的是第一个，也就是a[p]，同时表示是从数组的第一个元素开始遍历的。

选取j的目的是，我们要时刻知道当前最近一次比ref小的值的位置。由于我们选取的是a[r]，作为参考值，且从第一个元素开始遍历，为了跟踪最近一次比ref小的数的游标，暂时j=p-1。大家可以仔细体会一下这个做的意义。

观察上述代码可以看到，j总是记录着最近一次比ref小的数的游标，因此最后return j+1，所有比ref小的数的游标均小于j+1，所有比ref大的数的游标均大于j+1。

总之我们执行partition的目的就是为了得到A，B，以及中间数的游标，这样我们就可以分别对A和B重复执行上述动作。

接下来我们考虑另外两种选取ref的方法。从上面选取最后一个值a[r]，作为参考值，并且在最后，将a[r]和a[j+1]交换的动作可以知道，我们总是希望知道我们选取参考值在partition过程中的位置，以便我们可以在最后一步，将a[refId] 和 a[j+1]的值交换。这里的refId表示选取ref值在a[]中的游标，如果选取的是最后一个元素，则refId=r。

如果我们选取ref为最后一个值，那么在所有的partition过程中，这个值的位置是固定的。但是，假如我们选取的ref的refId是p到r范围内的一个随机数呢？

显然，假如我们随机选取ref的值，那么在partition过程中，refId对应的ref就有可能和其他值交换。这时候我们就需要更新ref对应的游标。

这样一来，思路就很清晰了。

先给出partition的伪代码：partition(a[], p, r){

　　refId = random(p,r)

　　i = p
　　j = p-1
　　for(; i<=r; i++)
　　{
　　　　if(a[i]<ref)
　　　　{
　　　　　　j++
　　　　　　if(j == refId)//此时j刚好等refId，并且要和a[i]交换，则更新refId
　　　　　　{
　　　　　　　　refId = i 
　　　　　　}

　　　　　　exchange(a[i], a[j])
　　　　}
　　}
　　exchange(a[j+1], a[refId])
　　return j+1
}

从三种选择ref的方法可以看到本质上都是一样的，都为用一个游标j记录最近一次遍历到的比ref小的数据的游标，然后将ref和a[j+1]交换，返回j+1。

下面给出C++的代码实现

#include <iostream>
#include <stack>
#include"stdlib.h"
#include <time.h>

using namespace std;
template<class T>
class SORT
{
    public:
        static void myQsort(T a[], int p, int r);
        static void myQsortNoRecur(T a[], int p, int r);
    private:
        static int partition(T a[], int p, int r);
        static void exchange(T a[], int i, int j);
};


template<class T>
void SORT<T>::exchange(T a[], int i, int j)
{
    T temp = a[i];
    a[i] = a[j];
    a[j] = temp;
    return;
}

template<class T>
int SORT<T>::partition(T a[],int p,int r)
{

    int i = p;
    int j = p-1;
    T ref = a[p];
    int refId = p;
    srand((unsigned)time(NULL));
    refId = (rand() % (r-p+1))+ p;
    //cout<<refId<<endl;
    ref = a[refId];
    for(; i<=r; i++)
    {
        if(a[i] < ref)
        {
            j++;
            exchange(a, i, j);
            if(j == refId)
            {
                refId = i;
            }
        }

    }
    exchange(a, j+1, refId);

    return j+1;
}

template<class T>
void SORT<T>::myQsort(T a[],int p,int r)
{
    int q = 0;
    if(p<r)
    {
        q = partition(a, p, r);
        myQsort(a, p, q-1);
        myQsort(a, p+1, r);
    }

    return;

}

template<class T>
void SORT<T>::myQsortNoRecur(T a[], int p, int r)
{
    int start = p;
    int end = r;
    int mid = 0;
    std::stack<int> sortStk;

    sortStk.push(p);
    sortStk.push(r);

    while(!sortStk.empty())
    {
        end = sortStk.top();
        sortStk.pop();
        start = sortStk.top();
        sortStk.pop();
        if(start < end)
        {
            mid = partition(a, start, end);
            sortStk.push(start);
            sortStk.push(mid -1);
            sortStk.push(mid + 1);
            sortStk.push(end);
        }
    }

}

int main(int argc, char** argv)
{
    int a[10];
    int b[10];
    srand((unsigned)time(NULL));
    for(int i=0; i<9; i++)
    {
        a[i] = rand();
    }

    srand((unsigned)time(NULL));
    for(int i=0; i<9; i++)
    {
        b[i] = rand();
    }

    SORT<int>::myQsort(a,0, 9);

    SORT<int>::myQsortNoRecur(b,0, 9);

    for(int i=0; i<10; i++)
    {
        cout<<a[i]<<" ";
    }
    cout<<endl;
    for(int i=0; i<10; i++)
    {
        cout<<b[i]<<" ";
    }
    return 0;
}

上面的代码我直接给出了快速排序的递归和非递归实现。
递归的实现方式很好理解，但是加入别人正在面试你快速排序算法的时候，多半会让你用非递归的方式实现给他看。下面我们就讨论一下。

先观察一下递归算法的运行过程，即每次都去对一段更小的范围去调用partition函数。所以我们需要知道每一次调用partition函数的start和end游标，同时，每一次partition调用都会产生新的start和end游标。

template<class T>
void SORT<T>::myQsort(T a[],int p,int r)
{
    int q = 0;
    if(p<r)
    {
        q = partition(a, p, r);
        myQsort(a, p, q-1);
        myQsort(a, p+1, r);
    }

    return;

}

这样的话，我们就可以用一个通用容器去存放每次调用partition生成的start和end游标。知道虽有的合法的start和end游标都作为参数调用了partition函数。所谓合法的start和end就是start < end。。。。。

关于递归算法的非递归实现，第一个想到的数据结构肯定是栈。其实别的数据结构，例如队列，也是可以实现。这里给出基于stl内的stack的实现方法。代码如下

template<class T>
void SORT<T>::myQsortNoRecur(T a[], int p, int r)
{
    int start = p;
    int end = r;
    int mid = 0;
    std::stack<int> sortStk;

    sortStk.push(p);
    sortStk.push(r);

    while(!sortStk.empty())
    {
        end = sortStk.top();
        sortStk.pop();
        start = sortStk.top();
        sortStk.pop();
        if(start < end)
        {
            mid = partition(a, start, end);
            sortStk.push(start);
            sortStk.push(mid -1);
            sortStk.push(mid + 1);
            sortStk.push(end);
        }
    }

}

上面代码的运行过程就是每次循环，从容器内拿一个start和end，如果是合法的，就依次将他们再次放入容易，直到这个容器为空未知。

给个运行实例吧，我在代码里面实现的是实现随机数排序，ref采用随机选取的方式。

晚安

posted @ 2017-07-19 01:47 24k的帅哥阅读(582) 评论(0) 收藏举报

刷新页面返回顶部

24k的帅哥

关于快速排序的理解。

公告