(转载)那些年我们一起学过的“排序算法”

(转载)http://www.cnblogs.com/BeyondAnyTime/archive/2012/08/14/2638070.html

排序算法是经常使用的算法,在STL中也有一个比较牛X的快速排序(sort),但是我们不能只会调用sort呀!?作为一个好学的同学,我们要知道各种排序的内部是怎么实现滴~~~提到排序算法我们要知道两个经常提到的概念:

(1)排序算法的稳定性:所谓“稳定性”是指,在待排序数组出现的两个相同的元素,排序之后相对维持保持不变。比如:待排序数组为arr[] = {1,4,3,1},排序之后元素变为arr_new[] = {1,1,4,3},并且arr_new中的第一个是arr中的第一个1,arr_new中的第二个1是arr中的第二个1,这是我们就说这种排序时稳定的。

(2)原地排序:所谓原地排序是指,不申请多余的空间来辅助完成排序算法,而是在原来的待排序的数据之上直接进行比较,交换,移动等操作。

1.插入排序

算法原理:将待排序的数组分为:有序区 和 无序区。然后每次从无序区取出第一个数据插入到有序区的正确位置,最终完成排序。

算法代码:

#include <iostream>

using namespace std;

void insert_sort(int *arr,int n)
{
    int i,j;
    for(i = 1 ; i < n ; ++i)
    {
        int tmp = arr[i];
        j = i - 1;
        while( j >= 0 && arr[j] > tmp)
        {
            arr[j+1] = arr[j];
            j--;
        }
        arr[j+1]  = tmp;
    }
}

int main()
{
    int arr[] = {2,4,1,3,5,8,7,6,8};
    insert_sort(arr,9);
    for(int i = 0  ; i < 9 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:看代码可以知道这种排序算法的时间复杂度是O(n^2),并且插入排序时稳定的,属于原地排序。那么什么时候使用插入排序比较好呢?那就是当数组中的大部分数据已经有序时,使用插入排序算法的效率比较高,这种情况下,所需要进行的数据移动较少,而数据移动正式插入排序算法的主要步骤~~~~

2.冒泡排序

算法原理:冒泡排序是经过n-1趟子排序完成的,第 i 趟子排序从第1个数至第 n-i+1 个数,若第 i 个数比第 i+1 个数大,则交换这两个数,实际上这样经过 i 次子排序就使得 第1个数至第 n-i +1个数之间最大的数交换到了n-i+1 的位置上了。实际上冒泡排序时可以优化的,那就是当第 i 次子排序并没有发生元素的交换时,就说明数组已经排好序了,以后的子排序就不用做了。

算法代码:

#include <iostream>

using namespace std;

void swap(int &x,int &y)
{
    x = x^y;
    y = x^y;
    x = x^y;
}

void bubble_sort(int *arr,int n)
{
    int i,j;
    for(i = n - 1 ; i > 0 ; --i)
    {
        bool flag = true;
        for(j = 0 ; j < i ; ++j)
        {
            if(arr[j] > arr[j+1])
            {
                flag = false;
                swap(arr[j],arr[j+1]);
            }
        }
        if(flag) //数组已经排好序没必要在继续进行其他子排序了
            break;
    }
}

int main()
{
    int arr[] = {2,1,4,3,8,7,5,6};
    bubble_sort(arr,8);
    for(int i = 0 ; i < 8 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:冒泡排序算法的时间复杂度是O(n^2),同时冒泡排序也是稳定的,并且属于原地排序,排序的效率取决于逆序对的多少。采用一点小优化也加速了冒泡排序。

3.选择排序

算法原理:所谓选择排序经过 n-1 次选择,当进行第 i 次选择时,是从第1个元素到第 n-i+1 的元素中选择最大的元素和第 n-i+1 个位置的元素交换,这样做比如第1 次选择使得最大的元素到了数组的最后一个位置。注意哦,在选择排序中每次选择时只进行一次数据的交换。

算法代码:

#include <iostream>

using namespace std;

void swap(int &x,int &y)
{
    int tmp = x;
    x = y;
    y = tmp;
}

void select_sort(int *arr,int n)
{
    int i,j;
    for(i = n-1 ; i > 0 ; --i)
    {
        int tmp = 0;
        for(j = 1 ; j <= i ; ++j)
        {
            if(arr[j] >= arr[tmp])//这里的“=”是保证选择排序稳定的关键
            {
                tmp = j;
            }
        }
        swap(arr[i],arr[tmp]);
    }
}
int main()
{
    int arr[] = {2,1,4,3,8,7,5,6};
    select_sort(arr,8);
    for(int i = 0 ; i < 8 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:选择排序的思路非常的简单,实现起来也不难。时间复杂度是O(n^2),选择排序也是稳定的排序,并且也是原地排序。选择排序的时间基本不受数据的影响,因为不管怎样都要进行n-1次选择排序。

4.归并排序

算法原理:归并排序的思想是分治,将一个带排序的数组分成两个较小的数组,然后分别进行排序,组后将两个排好序的较小的数组合并起来,就得到了原来数组的排序后的结果。应该注意的是这种将两个排好序的数组合并有一个较好的算法,时间复杂度是O(n1+n2)的。n1、n2分别是两个小数组的长度。

算法代码:

#include <iostream>

using namespace std;

void merge_sort(int *arr,int start,int end,int *temp)
{
    if(end > start+1)
    {
        int mid = start + (end - start) / 2;
        merge_sort(arr,start,mid,temp);
        merge_sort(arr,mid,end,temp);
        int i = start , j = mid , k = start;
        while(i < mid || j < end)
        {
            if(j >= end || (i < mid && arr[i] <= arr[j]))
            {
                temp[k++] = arr[i++];
            }
            else
            {
                temp[k++] = arr[j++];
            }
        }
        for(i = start ; i < end ; ++i)
        {
            arr[i] = temp[i];
        }
    }
}


int main()
{
    int temp[8];
    int arr[]  = {2,1,4,3,8,7,5,6};
    merge_sort(arr,0,8,temp);
    for(int i = 0 ; i < 8 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:归并排序时稳定的排序,但是不属于原地排序,因为用了额外的O(n)的空间,时间复杂度降到了O(n*log n),并且对任意的数组进行排序时间复杂度都能控制在O(n*logn)。

5.堆排序

算法原理:所谓的堆排序是利用完全二叉树的思想实现的。首先应该提到的是最大堆,在最大堆中(完全二叉树二叉树)中每个父节点都大于等于两个儿子节点的值,这时候很明显堆顶是元素的最大值,然后把堆顶元素和堆中最后一个元素(分层遍历的节点编号最大的元素)交换,这样最大值就落到了数组的arr[n-1]的位置,然后把前n-1元素继续按照上面的方式处理,如此进行n-1次就完成堆排序。

算法代码:

#include <iostream>

using namespace std;

void swap(int &x,int &y)
{
    x = x + y;
    y = x - y;
    x = x - y;
}

void quick_sort(int *arr,int s,int e)
{
    if(s+1 < e)
    {
        int tmp = arr[s];
        int i = s+1;
        int j = e-1;
        while(i < j)
        {
            while(i <= j && arr[i] <= tmp)
            {
                i++;
            }
            while(i <= j && arr[j] >= tmp)
            {
                j--;
            }
            if(i < j)
            {
                swap(arr[i],arr[j]);
            }
        }
        swap(arr[s],arr[i-1]);
        quick_sort(arr,s,i-1);
        quick_sort(arr,i,e);
    }
}

int main()
{
    int arr[] = {2,1,4,3,8,7,5,6};
    quick_sort(arr,0,8);
    for(int i = 0 ; i < 8 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:堆排序是不稳定的排序,但是堆排序属于原地排序。时间复杂度是O(n*log n),并且不需要额外的辅助空间,也就是说堆排序是一种不错的排序算法哦~~~

6.快速排序

算法原理:快速排序时这样的一种排序,选取数组中的第一个元素arr[0]作为依据,遍历一遍数组后,使得数组中的第一个元素进入正确的位置,即在该位置左面的元素均小于等于arr[0],在该位置右面的元素均大于等于arr[0]。然后,在对该位置左面和右面的元素分别进行快速排序,如此一来完成整个数组的排序。

算法代码:

#include <iostream>

using namespace std;

void swap(int &x,int &y)
{
    x = x + y;
    y = x - y;
    x = x - y;
}

void quick_sort(int *arr,int s,int e)
{
    if(s+1 < e)
    {
        int tmp = arr[s];
        int i = s+1;
        int j = e-1;
        while(i < j)
        {
            while(i <= j && arr[i] <= tmp)
            {
                i++;
            }
            while(i <= j && arr[j] >= tmp)
            {
                j--;
            }
            if(i < j)
            {
                swap(arr[i],arr[j]);
            }
        }
        swap(arr[s],arr[i-1]);
        quick_sort(arr,s,i-1);
        quick_sort(arr,i,e);
    }
}

int main()
{
    int arr[] = {2,1,4,3,8,7,5,6};
    quick_sort(arr,0,8);
    for(int i = 0 ; i < 8 ; ++i)
    {
        cout<<arr[i]<<" ";
    }
    cout<<endl;
    return 0;
}

小结:首先还是说明快速排序时不稳定的,但是是原地排序,不需要额外的空间,时间复杂度是O(nlog n),实际上,这种把第一个元素作为依据元素只是快速排序的一种,STL中的sort内部实现是根据排序到了不同的阶段选用不同的排序算法。当数据量大是采用quick_sort排序,当分段递归到了数据量小于某个数值时,为避免quick_sort的递归调用带来的额外开销,就改用insert_sort 了;如果递归层次过深,还会考虑使用heap_sort 。

 


学习中的一点总结,欢迎拍砖哦^^

 

posted @ 2013-10-13 18:49  robotke1  阅读(325)  评论(0编辑  收藏  举报