各种排序实现以及稳定性分析

一篇很好的讲8大排序的博客

选择排序 (不稳定)

选择排序是给每个位置选择当前元素最小的，比如给第一个位置选择最小的，在剩余元素里面给第二个元素选择第二小的，依次类推，直到第n-1个元素，第n个元素不用选择了，因为只剩下它一个最大的元素了。那么，在一趟选择中，如果当前元素比一个元素大，而该小的元素又出现在一个和当前元素相等的元素后面，那么交换后稳定性就被破坏了。比较拗口，举个例子，序列5 8 5 2 9，我们知道第一遍选择第1个元素5会和2交换，那么原序列中2个5的相对前后顺序就被破坏了，所以选择排序不是一个稳定的排序算法。

堆排序 (不稳定)

堆的结构是节点i的孩子为 2i 和 2i+1 节点，大顶堆要求父节点大于等于其2个子节点，小顶堆要求父节点小于等于其2个子节点。在一个长为n的序列，堆排序的过程,首先要根据floyd算法建堆，因此要从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n/2-1, n/2-2,...1这些个父节点选择元素时，就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了，而第n/2-1个父节点把后面一个相同的元素没有交换，那么这2个相同的元素之间的稳定性就被破坏了。所以，堆排序不是稳定的排序算法。
eg：{5A,6,5B,7,8} --> {8,7,5B,5A,6} ,两个5的顺序颠倒了。

插入排序 (稳定)

插入排序是在一个已经有序的小序列的基础上，一次插入一个元素。当然，刚开始这个有序的小序列只有1个元素，就是第一个元素。插入调用有序序列的search操作，该操作返回的是第一个大于该元素的位置，相等元素的前后顺序没有改变，从原无序序列出去的顺序就是排好序后的顺序，所以插入排序是稳定的。

希尔排序 (不稳定)

希尔排序是按照不同步长对元素进行插入排序，当刚开始元素很无序的时候，步长最大，所以插入排序的元素个数很少，速度很快；当元素基本有序了，步长很小，插入排序对于有序的序列效率很高。所以，希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序，我们知道一次插入排序是稳定的，不会改变相同元素的相对顺序，但在不同的插入排序过程中，相同的元素可能在各自的插入排序中移动，最后其稳定性就会被打乱，所以shell排序是不稳定的。

冒泡排序 (稳定)

冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较，交换也发生在这两个元素之间。所以，如果两个元素相等，我想你是不会再无聊地把他们俩交换一下的；如果两个相等的元素没有相邻，那么即使通过前面的两两交换把两个相邻起来，这时候也不会交换，所以相同元素的前后顺序并没有改变，所以冒泡排序是一种稳定排序算法。

快速排序 (不稳定)

快速排序有两个方向，当a[i] <= a[center_index]，左边的i下标一直往右走，其中center_index是中枢元素的数组下标，一般取为数组第0个元素。
当a[j] > a[center_index]，右边的j下标一直往左走。如果i和j都走不动了，i <= j,交换a[i] 和 a[j],重复上面的过程，直到i>j。交换a[j]和a[center_index]，完成一趟快速排序。在中枢元素和a[j]交换的时候，很有可能把前面的元素的稳定性打乱.
比如序列为 5 3 3 4 3 8 9 10 11，现在中枢元素5和3(第5个元素，下标从1开始计)交换就会把元素3的稳定性打乱，所以快速排序是一个不稳定的排序算法，不稳定发生在中枢元素和a[j]交换的时刻。

归并排序 (稳定)

归并排序是把序列递归地分成短序列，递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有序的长序列，不断合并直到原序列全部排好序。可以发现，在1个或2个元素时，1个元素不会交换，2个元素如果大小相等也没有人故意交换，这不会破坏稳定性。那么，在短的有序序列合并的过程中，稳定是是否受到破坏？没有，合并过程中我们可以保证如果两个当前元素相等时，我们把处在前面的序列的元素保存在结果序列的前面，这样就保证了稳定性。所以，归并排序也是稳定的排序算法。

基数排序 (稳定)

基数排序是按照低位先排序，然后收集；再按照高位排序，然后再收集；依次类推，直到最高位。有时候有些属性是有优先级顺序的，先按低优先级排序，再按高优先级排序，最后的次序就是高优先级高的在前，高优先级相同的低优先级高的在前。基数排序基于分别排序，分别收集，所以其是稳定的排序算法。

1.快速排序

#include<iostream>
#include<vector>
using namespace std;


void swap(int &p, int &q)
 {
         int temp;
         temp = p;
         p = q;
         q = temp;
}

int  partition(vector<int>&array, int lo, int hi){
    swap(array[lo], array[lo + rand() % (hi - lo + 1)]);//产生[lo,hi]之间的一个随机数
    int pivot = array[lo];
    while (lo < hi){
        //swap
        while ((lo < hi) && pivot <= array[hi])
        {
            hi--;
        }
        //array[lo] = array[hi];
        swap(array[lo], array[hi]);
        while ((lo < hi) && pivot >= array[lo])
        {
            lo++;
        }
        //array[hi] = array[lo];
        swap(array[lo], array[hi]);
    }
    //array[lo] = pivot;
    return lo;
}
void quicksort(vector<int>&array, int lo, int hi){
    if (hi - lo < 1)return;
    int mi = partition(array, lo, hi);
    quicksort(array, lo, mi-1);
    quicksort(array, mi + 1, hi);

}

int partition(vector<int>&array, int lo, int hi){
    int pivot = array[lo];
    while (lo < hi){
        while (lo < hi&&pivot <= array[hi])hi--;
        swap(array[lo], array[hi]);
        while (lo < hi&&pivot >= array[lo])lo++;
        swap(array[lo], array[hi]);
    }
    return lo;
}

/**使用栈的非递归快速排序**/
void quicksort2(vector<int> &vec, int low, int high){
    stack<int> st;
    if (low<high){
        int mid = partition(vec, low, high);
        if (low<mid - 1){
            st.push(low);
            st.push(mid - 1);
        }
        if (mid + 1<high){
            st.push(mid + 1);
            st.push(high);
        }
        //其实就是用栈保存每一个待排序子串的首尾元素下标，下一次while循环时取出这个范围，对这段子序列进行partition操作
        while (!st.empty()){
            int q = st.top();
            st.pop();
            int p = st.top();
            st.pop();
            mid = partition(vec, p, q);
            if (p<mid - 1){
                st.push(p);
                st.push(mid - 1);
            }
            if (mid + 1<q){
                st.push(mid + 1);
                st.push(q);
            }
        }
    }
}

2.归并排序

void merge(vector<int>&input, int left, int right, int mid, vector<int>&temp){
    int i = left;
    int j = mid+1;
    int t = 0;
    while (i<=mid&&j<=right){
        if (input[i] <= input[j]){
            temp[t++] = input[i++];
        }
        else{
            temp[t++] = input[j++];
        }
    }
    while (i <= mid){
        temp[t++] = input[i++];
    }
    while (j <= right){
        temp[t++] = input[j++];
    }
    t = 0;
    while (left <= right){
        input[left++] = temp[t++];
    }
}

void mergesort(vector<int>&input, int left, int right, vector<int>&temp){
    if (left < right){
        int mid = (left + right) / 2;
        mergesort(input, left, mid, temp);
        mergesort(input, mid + 1, right, temp);
        merge(input, left, right, mid, temp);
    }
}

3.堆排序

/* 
 * (最大)堆的向下调整算法
 *
 * 注：数组实现的堆中，第N个节点的左孩子的索引值是(2N+1)，右孩子的索引是(2N+2)。数组是按层编号的。
 *     其中，N为数组下标索引值，如数组中第1个数对应的N为0。
 *
 * 参数说明：
 *     a -- 待排序的数组
 *     start -- 被下调节点的起始位置(一般为0，表示从第1个开始)
 *     end   -- 截至范围(一般为数组中最后一个元素的索引)
 */
void maxheap_down(int a[], int start, int end)
{
    int c = start;            // 当前(current)节点的位置
    int l = 2*c + 1;        // 左(left)孩子的位置
    int tmp = a[c];            // 当前(current)节点的大小
    for (; l <= end; c=l,l=2*l+1)
    {
        // "l"是左孩子，"l+1"是右孩子
        if ( l < end && a[l] < a[l+1])
            l++;        // 左右两孩子中选择较大者，即m_heap[l+1]
        if (tmp >= a[l])
            break;        // 调整结束
        else            // 交换值
        {
            a[c] = a[l];
            a[l]= tmp;
        }
    }
}

/*
 * 堆排序(从小到大)
 *
 * 参数说明：
 *     a -- 待排序的数组
 *     n -- 数组的长度
 */
void heap_sort_asc(int a[], int n)
{
    int i;

    // 从(n/2-1) --> 0逐次遍历。遍历之后，得到的数组实际上是一个(最大)二叉堆。从下到上，从左到右遍历父节点调整
    for (i = n / 2 - 1; i >= 0; i--)
        maxheap_down(a, i, n-1);

    // 从最后一个元素开始对序列进行调整，不断的缩小调整的范围直到第一个元素
    for (i = n - 1; i > 0; i--)
    {
        // 交换a[0]和a[i]。交换后，a[i]是a[0...i]中最大的。
        swap(a[0], a[i]);
        // 调整a[0...i-1]，使得a[0...i-1]仍然是一个最大堆。
        // 即，保证a[i-1]是a[0...i-1]中的最大值。//下面一条语句start=0是因为第一个父节点改变了值，要重新调整为最大堆
        maxheap_down(a, 0, i-1);
    }
}

/ brief /

void makeheap_down(vector<int>&array, int start, int end){
    int c = start;//c是当前要下滤的节点
    for (int i = 2 * start + 1; i <= end; c = i, i = 2 * i + 1){
        if (i<end&&array[i] < array[i + 1])i++;//i<end不能漏，不然i=end;i+1超出范围
        if (array[c] >= array[i])break; 
        else{ 
            swap(array[c], array[i]); 
        }
    }
} 
/*堆排序*/ 
void maxheap_sort(vector<int>&a, int n){ 
    //第一个for循环构建最大堆，n为向量长度 
    for (int i = n / 2 - 1; i >= 0; i--) 
        makeheap_down(a, i, n-1); 
    //第二个for循环用来排序 
    for (int i = n-1; i>0; i--){ 
        swap(a[0], a[i]); 
        makeheap_down(a, 0, i-1);//再次调整为最大堆 ，i不能=0 
    } 
}

4.选择排序

void select_sort(vector<int>&a){
    for (int i = 0; i < a.size()-1; i++){
        int min_index = i;
        for (int j = i+1; j < a.size(); j++){
            if (a[j] < a[min_index]){
                min_index = j;
            }
        }
        if (min_index!=i)swap(a[i], a[min_index]);
    }
}

5.冒泡排序

void bubble_sort(vector<int>&a){
    for (int i = 0; i < a.size()-1; i++){
        for (int j = 0; j < a.size()-1-i; j++){
            if (a[j] > a[j + 1]){
                //swap(a[j], a[j + 1]);
                int tmp = a[j];
                a[j] = a[j + 1];
                a[j + 1] = tmp;
            }
        }
    }
}

6.插入排序

void insert_sort(vector<int>&a){
    for (int i = 1; i < a.size(); i++){
        int j = i;
        while (j>0 && a[j] < a[j - 1]){
            swap(a[j], a[j - 1]);
            j--;
        }
    }
}

7.桶排序和基数排序

void bucketSort(vector<int>&input,int max){
    vector<int>bucket(max, 0);//max是要排序数组中的最大值+1
    for (int i = 0; i < input.size(); i++){
        bucket[input[i]]++;
    }
    for (int i = 0,j=0; i < max; i++){
        while ((bucket[i]--)> 0){//可以排序重复数字
            input[j++] = i;
        }
    }
}

基数排序补充：基数排序(Radix Sort)是桶排序的扩展，它的基本思想是：将整数按位数切割成不同的数字，然后按每个位数分别比较。
具体做法是：将所有待比较数值统一为同样的数位长度，数位较短的数前面补零。然后，从最低位开始，依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。

/*
 * 获取数组a中最大值
 *
 * 参数说明：
 *     a -- 数组
 *     n -- 数组长度
 */
int get_max(int a[], int n)
{
    int i, max;

    max = a[0];
    for (i = 1; i < n; i++)
        if (a[i] > max)
            max = a[i];
    return max;
}

/*
 * 对数组按照"某个位数"进行排序(桶排序)
 *
 * 参数说明：
 *     a -- 数组
 *     n -- 数组长度
 *     exp -- 指数。对数组a按照该指数进行排序。
 *
 * 例如，对于数组a={50, 3, 542, 745, 2014, 154, 63, 616}；
 *    (01) 当exp=1表示按照"个位"对数组a进行排序
 *    (02) 当exp=10表示按照"十位"对数组a进行排序
 *    (03) 当exp=100表示按照"百位"对数组a进行排序
 *    ...
 */
void count_sort(int a[], int n, int exp)
{
    int output[n];             // 存储"被排序数据"的临时数组
    int i, buckets[10] = {0};

    // 将数据出现的次数存储在buckets[]中
    for (i = 0; i < n; i++)
        buckets[ (a[i]/exp)%10 ]++;

    // 更改buckets[i]。目的是让更改后的buckets[i]的值，是该数据在output[]中的位置。
    for (i = 1; i < 10; i++)
        buckets[i] += buckets[i - 1];

    // 将数据存储到临时数组output[]中
    for (i = n - 1; i >= 0; i--)
    {
        output[buckets[ (a[i]/exp)%10 ] - 1] = a[i];
        buckets[ (a[i]/exp)%10 ]--;
    }

    // 将排序好的数据赋值给a[]
    for (i = 0; i < n; i++)
        a[i] = output[i];
}

/*
 * 基数排序
 *
 * 参数说明：
 *     a -- 数组
 *     n -- 数组长度
 */
void radix_sort(int a[], int n)
{
    int exp;    // 指数。当对数组按各位进行排序时，exp=1；按十位进行排序时，exp=10；...
    int max = get_max(a, n);    // 数组a中的最大值

    // 从个位开始，对数组a按"指数"进行排序
    for (exp = 1; max/exp > 0; exp *= 10)
        count_sort(a, n, exp);
}

posted @ 2018-05-10 19:48 追逐更好的自己阅读(4949) 评论(0) 编辑收藏举报

刷新页面返回顶部

追逐面包和牛奶