桶排序
【1】桶排序
桶排序(也称箱排序),据坊间演绎,其实现方式有很多。
在此我们仅仅阐述一下本文的实现思想,以便于更好的理解下面的内容,同时加深对桶排序的认识。
首先,说明一点,我们是使用数组模拟桶(最好应该是使用链表模拟)。
所谓数组模拟桶实现排序的过程到底是怎么进行的呢?呵呵!其实还真有点抽象。
实现步骤如下:
(1)定义映射函数
<1>求得欲排数据序列中的最大数据。
<2>通过遍历欲排数据对每个数据乘以10再与最大数据取余,求得每个数据对应桶的索引(或称关键字)。
(2)求得每个桶中盛放的数据个数(为了保证随后准确分配数据)
(3)求得每个桶盛放数据个数的右边界索引(所谓的桶逻辑控制)
(4)从右向左(确保稳定性)扫描欲排数据序列,依次分配到对应桶中
(5)对各桶中所盛数据进行收集
(6)利用插入排序再对各个桶中所盛数据进行排序
(7)直至排序结束,即为已排序数据序列
其实,整个过程再讲通俗一点,可以如下描述:
建立一个数组作为我们的所谓的桶(逻辑桶)
然后,申请开辟与欲排数据所占空间相同的内存,作为真正的盛放数据的桶(物理桶)
数组的索引默认为桶号
对数组的每一次赋值都有着不同的意义(请参考代码分析)
最后再用插入排序对各桶中所收集数据分别进行排序。即完成桶排序。
总而言之:先分类,后收集,再排序。
【2】示例代码及其分析过程
(1)代码如下:
1 #include<iostream>
2 #include<malloc.h>
3 using namespace std;
4
5
6 void PrintArr(int ar[],int n)
7 {
8 for(int i = 0; i < n; ++i)
9 cout<<ar[i]<<" ";
10 cout<<endl;
11 }
12
13 int MapToIndex(int x,int max)
14 {
15 return (10 * x) / max;
16 }
17
18 void insertion_sort(int arr[],int begin,int end)
19 {
20 for(int i = begin+1; i <= end; ++i)
21 {
22 int v = arr[i];
23 int j = i;
24 while(j-1 >= begin && v<arr[j-1])
25 {
26 arr[j--] = arr[j-1];
27 }
28 arr[j] = v;
29 }
30 }
31
32 void bucket_sort(int ar[], int begin, int end)
33 {
34
35 const int radix = 11 ; //注意:为什么是11?
36 int count[radix], i, j;
37 int size = end-begin+1;
38
39 //计数值置空
40 for(i = 0; i < radix; ++i)
41 {
42 count[i] = 0; //置空
43 }
44
45 //end-begin+1 = 9 - 0 + 1 = 10
46 int *Temp = (int *) malloc((size) * sizeof(int)); //分配临时空间
47
48 //取得当前待排序数据中的最大数据
49 int max = 0;
50 for(i = begin; i < size; ++i)
51 {
52 if(ar[i] > max)
53 max = ar[i];
54 }
55
56 //统计各桶需要装的元素的个数
57 for(i = begin; i < size; ++i)
58 {
59 count[MapToIndex(ar[i], max)]++;
60 }
61
62 //输出计数结果:
63 PrintArr(count, radix);
64
65 //求出桶的边界索引,count[i]为第i个桶的右边界索引+1
66 for(i = 1; i < radix; ++i)
67 {
68 count[i] = count[i] + count[i-1];
69 }
70
71 //输出桶边界索引
72 PrintArr(count, radix);
73
74 //从右向左扫描,保证排序稳定性
75 for(i = end; i >= begin; --i)
76 {
77 j = MapToIndex(ar[i], max);
78 Temp[count[j]-1] = ar[i]; //放入对应的空间中,count[j]-1是第j个桶的右边界索引
79 --count[j]; //准备放置下一个元素的位置索引
80 }
81
82 for(int i = 0; i < size; ++i)
83 {
84 cout<<Temp[i]<<" ";
85 }
86 cout<<endl;
87
88 PrintArr(count, radix);
89
90 //从各个桶中收集数据
91 for(i = begin, j = 0; i < size; i++, j++)
92 {
93 ar[i] = Temp[j];
94 }
95
96 PrintArr(ar, end+1);
97
98 //释放空间
99 free(Temp);
100
101 for(i = 0; i < size; i++)
102 {
103 int index1 = begin + count[i]; //得到第i个桶的左边界
104 int index2 = begin + count[i+1] - 1; //得到第i个桶的右边界
105 if(index1 < index2)
106 insertion_sort(ar, index1, index2);
107 }
108 }
109
110 void main()
111 {
112 int ar[] = {12, 14, 54, 5, 6, 3, 9, 8, 47, 89};
113 int len = sizeof(ar)/sizeof(int);
114 bucket_sort(ar, 0, len-1);
115 PrintArr(ar, len);
116 }
117 /*
118 4 3 0 0 0 1 1 0 0 0 1
119 4 7 7 7 7 8 9 9 9 9 10
120 5 6 3 8 12 14 9 47 54 89
121 0 4 7 7 7 7 8 9 9 9 9
122 5 6 3 8 12 14 9 47 54 89
123 3 5 6 8 9 12 14 47 54 89
124 */
(2)分析过程如下:
学过数据结构的估计都可以想象得到:桶排序中所谓的桶应该是用一个单链表实现
因为,我们一直觉得,计算机世界就是对现实世界的模拟。那么,既然是山寨,当然越逼真越好
但是,假如我们没有学习过单链表,脑子里面根本没有单链表的概念。而且,我们要实现桶排序。
好吧!我唯一可以借助的就是数组。
不过数组模拟桶实现桶排序的确不是很好理解,有几分抽象
上面这就是一个用数组模拟桶实现的桶排序示例代码,现在做一下具体分析,希望可以更深刻理解桶排序。
分析过程如下:
(1)待排序数据序列为:
(2)count数组本质上是逻辑的桶,为什么说是逻辑上的桶?因为,它控制着桶的所有数据逻辑
但是申请的内存Temp才是每个桶的真正储存空间,所以只能说是逻辑上的桶。
而当数据被分配到各个桶中又从桶(即就是从申请空间)被收集之后,就对申请空间进行释放(因为留着再没有必要)。
如何理解以上内容?请结合一下图示理解具体分析:
第一行:所建桶的索引(可以看到总共为11个桶)
为什么是11个桶?由我们在对待排数据求输入桶对应的索引时匹配函数(MapToIndex)决定。
由于最大数据输入匹配函数后所得桶对应索引为10。所以,在此必须如此设计。
第二行:所有桶置空
第三行:每个桶中待盛的数据个数
第四行:每个桶的右边界索引
如何理解右边界索引?
比如0号桶,第三行已经得出其待盛四个数据,那么将来数据就会存入Temp[0],Temp[1],Temp[2],Temp[3]
比如1号桶,第三行已经得出其待盛三个数据,那么将来数据就会存入Temp[4],Temp[5],Temp[6]
第五行:待排数据全部放入各个桶中后,桶的左边界索引(这个是为了下面插入排序使用)。
(3)对每一个桶(即就是申请空间)中所盛的数据再利用插入排序进行排序
(4)数组中的数据即为已排序序列
【3】桶排序分析
桶排序是稳定排序算法。
桶排序使用范围比较窄。
Good Good Study, Day Day Up.
顺序 选择 循环 坚持 总结