桶排序

【1】桶排序

桶排序（也称箱排序），据坊间演绎，其实现方式有很多。

在此我们仅仅阐述一下本文的实现思想，以便于更好的理解下面的内容，同时加深对桶排序的认识。

首先，说明一点，我们是使用数组模拟桶（最好应该是使用链表模拟）。

所谓数组模拟桶实现排序的过程到底是怎么进行的呢？呵呵！其实还真有点抽象。

实现步骤如下：

（1）定义映射函数

<1>求得欲排数据序列中的最大数据。

<2>通过遍历欲排数据对每个数据乘以10再与最大数据取余，求得每个数据对应桶的索引（或称关键字）。

（2）求得每个桶中盛放的数据个数（为了保证随后准确分配数据）

（3）求得每个桶盛放数据个数的右边界索引（所谓的桶逻辑控制）

（4）从右向左（确保稳定性）扫描欲排数据序列，依次分配到对应桶中

（5）对各桶中所盛数据进行收集

（6）利用插入排序再对各个桶中所盛数据进行排序

（7）直至排序结束，即为已排序数据序列

其实，整个过程再讲通俗一点，可以如下描述：

建立一个数组作为我们的所谓的桶（逻辑桶）

然后，申请开辟与欲排数据所占空间相同的内存，作为真正的盛放数据的桶（物理桶）

数组的索引默认为桶号

对数组的每一次赋值都有着不同的意义（请参考代码分析）

最后再用插入排序对各桶中所收集数据分别进行排序。即完成桶排序。

总而言之：先分类，后收集，再排序。

【2】示例代码及其分析过程

（1）代码如下：

  1 #include<iostream>
  2 #include<malloc.h>
  3 using namespace std;
  4 
  5 
  6 void  PrintArr(int ar[],int n)
  7 {
  8     for(int i = 0; i < n; ++i)
  9         cout<<ar[i]<<" ";
 10     cout<<endl;
 11 }
 12 
 13 int MapToIndex(int x,int max)  
 14 {  
 15     return (10 * x) / max;  
 16 } 
 17 
 18 void insertion_sort(int arr[],int begin,int end)
 19 {

 20     for(int i = begin+1; i <= end; ++i)
 21     {
 22         int v = arr[i];
 23         int j = i;
 24         while(j-1 >= begin && v<arr[j-1])
 25         {
 26             arr[j--] = arr[j-1];  
 27         }
 28         arr[j] = v;
 29     }
 30 } 
 31 
 32 void bucket_sort(int ar[], int begin, int end)  
 33 {  
 34 
 35     const int radix = 11 ;  //注意：为什么是11？
 36     int count[radix], i, j;    
 37     int size = end-begin+1;
 38 
 39     //计数值置空
 40     for(i = 0; i < radix; ++i)  
 41     {
 42         count[i] = 0;    //置空
 43     }
 44     
 45     //end-begin+1 = 9 - 0 + 1 = 10
 46     int *Temp = (int *) malloc((size) * sizeof(int));     //分配临时空间
 47 
 48     //取得当前待排序数据中的最大数据
 49     int max = 0;  
 50     for(i = begin; i < size; ++i)  
 51     {  
 52         if(ar[i] > max)  
 53             max = ar[i];  
 54     }  
 55 
 56     //统计各桶需要装的元素的个数  
 57     for(i = begin; i < size; ++i)   
 58     {
 59         count[MapToIndex(ar[i], max)]++;   
 60     }
 61           
 62     //输出计数结果：
 63     PrintArr(count, radix);
 64 
 65     //求出桶的边界索引，count[i]为第i个桶的右边界索引+1   
 66     for(i = 1; i < radix; ++i)   
 67     {
 68         count[i] = count[i] + count[i-1];  
 69     }
 70 
 71     //输出桶边界索引        
 72     PrintArr(count, radix);
 73 
 74     //从右向左扫描，保证排序稳定性   
 75     for(i = end; i >= begin; --i)             
 76     {    
 77         j = MapToIndex(ar[i], max);        
 78         Temp[count[j]-1] = ar[i];  //放入对应的空间中，count[j]-1是第j个桶的右边界索引   
 79         --count[j];       //准备放置下一个元素的位置索引   
 80     }     
 81 
 82     for(int i = 0; i < size; ++i)
 83     {
 84         cout<<Temp[i]<<"  ";
 85     }
 86     cout<<endl;
 87 
 88     PrintArr(count, radix);
 89 
 90     //从各个桶中收集数据   
 91     for(i = begin, j = 0; i < size; i++, j++)  
 92     {
 93         ar[i] = Temp[j];        
 94     }
 95     
 96     PrintArr(ar, end+1);
 97 
 98      //释放空间  
 99     free(Temp);                          
100     
101     for(i = 0; i < size; i++)  
102     {   
103         int index1 = begin + count[i];             //得到第i个桶的左边界   
104         int index2 = begin + count[i+1] - 1;       //得到第i个桶的右边界   
105         if(index1 < index2)  
106             insertion_sort(ar, index1, index2);          
107     }  
108 }  
109 
110 void  main()
111 {
112     int  ar[] = {12, 14, 54, 5, 6, 3, 9, 8, 47, 89};
113     int len = sizeof(ar)/sizeof(int);
114     bucket_sort(ar, 0, len-1);
115     PrintArr(ar, len);
116 }
117 /*
118 4 3 0 0 0 1 1 0 0 0 1
119 4 7 7 7 7 8 9 9 9 9 10
120 5  6  3  8  12  14  9  47  54  89
121 0 4 7 7 7 7 8 9 9 9 9
122 5 6 3 8 12 14 9 47 54 89
123 3 5 6 8 9 12 14 47 54 89
124 */

（2）分析过程如下：

学过数据结构的估计都可以想象得到：桶排序中所谓的桶应该是用一个单链表实现

因为，我们一直觉得，计算机世界就是对现实世界的模拟。那么，既然是山寨，当然越逼真越好

但是，假如我们没有学习过单链表，脑子里面根本没有单链表的概念。而且，我们要实现桶排序。

好吧！我唯一可以借助的就是数组。

不过数组模拟桶实现桶排序的确不是很好理解，有几分抽象

上面这就是一个用数组模拟桶实现的桶排序示例代码，现在做一下具体分析，希望可以更深刻理解桶排序。

分析过程如下：

（1）待排序数据序列为：

（2）count数组本质上是逻辑的桶，为什么说是逻辑上的桶？因为，它控制着桶的所有数据逻辑

但是申请的内存Temp才是每个桶的真正储存空间，所以只能说是逻辑上的桶。

而当数据被分配到各个桶中又从桶（即就是从申请空间）被收集之后，就对申请空间进行释放（因为留着再没有必要）。

如何理解以上内容？请结合一下图示理解具体分析:

第一行：所建桶的索引（可以看到总共为11个桶）

为什么是11个桶？由我们在对待排数据求输入桶对应的索引时匹配函数（MapToIndex）决定。

由于最大数据输入匹配函数后所得桶对应索引为10。所以，在此必须如此设计。

第二行：所有桶置空

第三行：每个桶中待盛的数据个数

第四行：每个桶的右边界索引

如何理解右边界索引？

比如0号桶，第三行已经得出其待盛四个数据，那么将来数据就会存入Temp[0],Temp[1],Temp[2],Temp[3]

比如1号桶，第三行已经得出其待盛三个数据，那么将来数据就会存入Temp[4],Temp[5],Temp[6]

第五行：待排数据全部放入各个桶中后，桶的左边界索引（这个是为了下面插入排序使用）。

（3）对每一个桶（即就是申请空间）中所盛的数据再利用插入排序进行排序

（4）数组中的数据即为已排序序列

【3】桶排序分析

桶排序是稳定排序算法。

桶排序使用范围比较窄。

Good Good Study, Day Day Up.

顺序选择循环坚持总结

posted @ 2013-01-19 00:20 kaizenly 阅读(3720) 评论(1) 编辑收藏举报

刷新页面返回顶部

kaizenly

编码以明志调试而致远

桶排序

公告

kaizenly

编码以明志 调试而致远

桶排序

公告

编码以明志调试而致远