基数排序简述

  在学习了计数排序后,可以发现一个很严重的问题,如果数据很大呢,不如说每个元素小于2^64 - 1,不仅超时,而且正常数据下内存直接炸了。

  (虽然可以直接用快排,但是为了讲解基数排序还是讲一下基数排序)

  基数排序可以说成是改良版的桶排(有点类似,基数排序还是属于一种"分配式"排序),还是将一些数放入指定的桶中

比如一串数  12  33  43  54  65  39  45  72  89

首先按照个位分配到 0 - 10 这11个“桶”中

 0
 1 
 2 12  72
 3 33  43
 4 54
 5 65  45
 6
 7 
 8 
 9 39  89

接着再串起来,得到了下面这样的数列

12    72    33    43    54    65    45    39    89

再按照十位进行分配桶

 0
 1 12
 2 
 3 33  39
 4 43  45
 5 54
 6 65
 7 72
 8 89
 9 

同上,再把这些桶串起来

12    33    39    43    45    54    65    72    89   

这时候的数列已经是有序的了,不需要下一轮的分配了

这样不如说成从低位到高位,按位排序

可能可以想到,有没有可能出现从小到大排序出现这样的情况

  46  42

这样是不会出现的,稍微想一下就可以明白

  先按个位排序,46第一次排序完了一定是在42的后面

  再按十位排序,在4这个桶内46一定是42后面,因为是按顺序放在后面

上面这种方法又叫做LSD(最低位优先)法,先给出LSD的实现(中间用到了

计数排序,和上面有一点不同,但是仍然不难理解)

 1 #include<iostream>
 2 #include<cstring>
 3 #include<cstdio>
 4 using namespace std;
 5 int* counter;
 6 int* buf;
 7 int maxbit(int* array, int len){
 8     int result = 1;
 9     int p = 1;
10     for(int i = 0;i < len;i++){
11         while(((p << 3) + (p << 1)) <= array[i]){
12             p = (p << 3) + (p << 1);        //p *= 10; 
13             result++;
14         }
15     }
16     return result;
17 }
18 void radixSort(int* &array, int len){
19     buf = new int[(const int)(len + 1)];
20     counter = new int[11];
21     int limit = maxbit(array, len);
22     int p = 1;
23     for(int i = 0;i < limit;i++){
24         memset(counter, 0, sizeof(int) * 11);
25         for(int j = 0;j < len;j++)
26             counter[(array[j] / p) % 10]++;
27         for(int j = 1;j < 11;j++)
28             counter[j] += counter[j - 1];
29         for(int j = len - 1;j >= 0;j--)
30             buf[--counter[(array[j] / p) % 10]] = array[j];
31         swap(array, buf);
32         p = (p << 3) + (p << 1);
33     }
34     delete[] buf;
35     delete[] counter;
36 }
37 int n;
38 int *a;
39 int main(){
40     cin>>n;
41     a = new int[(const int)n];
42     for(int i = 0;i < n;i++)
43         cin>>a[i];
44     radixSort(a, n);
45     for(int i = 0;i < n;i++)
46         cout<<a[i]<<" ";
47     return 0;
48 } 
LSD

  如果从高位开始按位排序又叫做MSD(最高位优先)法

如果您按照上面那种方法去做,很快就可以发现在对于这样一组数据是不行的

  32  13  12

  MSD的做法除了顺序外还有不同之处,如果一个桶中的元素不止一个,就对这个桶中

的元素进行下一位的排序

  例如上面这组数据,首先第一轮分配

0
1 13  12
2 
3 32

1这个桶内的元素不止一个,递归调用进行第二轮分配,分配个位

0 
1 
2 12
3 13

发现所有的桶中的元素都没有超过1个,返回(另外还要拷贝并覆盖原来那

  如果像LSD那样用计数排序(省内存),貌似不太好处理,不过请仔细观察counter数组

在排序的过程中,counter对应位上值会减去一,排序完后这一位相当于前一位原来的值

  如果counter[i] != counter[i + 1]说明i这个桶中有东西,计算有多少个东西就直接

counter[i + 1] - counter[i]就能算出来了,起始位置就是array[counter[i]],这样就解决

另外还要注意,如果是最低位就不用再递归调用了(如果忘记这一点可能不会超时,应该很快就

会整数被0除)

  附上MSD的代码(也没改多少)

 1 #include<iostream>
 2 #include<cstring>
 3 #include<cstdio>
 4 using namespace std;
 5 int* buf;
 6 int p;
 7 int maxbit(int* array, int len){
 8     int result = 1;
 9     p = 1;
10     for(int i = 0;i < len;i++){
11         while(((p << 3) + (p << 1)) <= array[i]){
12             p = (p << 3) + (p << 1);        //p *= 10; 
13             result++;
14         }
15     }
16     return result;
17 }
18 /**
19  * 基数排序MSD法 
20  * @param array 数组的起始位置
21  * @param len 长度
22  * @param status 辅助作用 
23  */ 
24 void radixSort(int* array, int len, int status){
25     buf = new int[(const int)(len + 1)];
26     int* counter = new int[11];            //一定要定成局部变量 
27     memset(counter, 0, sizeof(int) * 11);
28     for(int j = 0;j < len;j++)
29         counter[(array[j] / status) % 10]++;
30     for(int j = 1;j < 10;j++)
31         counter[j] += counter[j - 1];
32     for(int j = len - 1;j >= 0;j--)
33         buf[--counter[(array[j] / status) % 10]] = array[j];
34     for(int i = 0;i < len;i++)
35         array[i] = buf[i];
36     delete[] buf;
37     for(int i = 0;i < 9;i++){                /* 这里开始 */ 
38         int l = counter[i];
39         int r = counter[i + 1] - 1;
40         if(l < r && status > 1){
41             radixSort(array + counter[i], r - l + 1, status / 10);
42         }
43     }                                        /* 这里结束 */ 
44     delete[] counter;
45 }
46 int n;
47 int *a;
48 int main(){
49     cin>>n;
50     a = new int[(const int)n];
51     for(int i = 0;i < n;i++)
52         cin>>a[i];
53     maxbit(a, n);
54     radixSort(a, n, p);
55     for(int i = 0;i < n;i++)
56         cout<<a[i]<<" ";
57     return 0;
58 } 
MSD

[后话]

  看完之后,仔细思考,应该可以发现一个很严重的问题——不能给负数排序

那怎么办呢?

那我就说说的几种方法(当然差值不能太大)

  1)全部加上最小的负数的相反数,输出时候减去这么多

  2)将非负整数用一个数组存储,将负数用另外一个数组存储,负数并且全部取反(是数学上的-)

   先将前者排序,再将后者用同一个函数排序,输出的时候先输出后者,从高下标往低下标输出,

   并把负号添上,再输出前者,从低下标到高下标


  基数排序给整数排序的时候并不是用得特别多,更多的时候是用于比较复杂度不是O(1)(多关键字)的时候排序,比如说年月日等等,

后缀数组的构造(当然要用倍增)用基数排序也会比用快排快很多

 

posted @ 2016-08-09 12:22  阿波罗2003  阅读(453)  评论(0编辑  收藏  举报