O(n)时间的排序---计数排序
题目:某公司有几万名员工,请完成一个时间复杂度为O(n)的算法对该公司员工的年龄作排序,可使用O(1)的辅助空间。
分析:排序是面试时经常被提及的一类题目,我们也熟悉其中很多种算法,诸如插入排序、归并排序、冒泡排序,快速排序等等。这些排序的算法,要么是O(n2)的,要么是O(nlogn)的。可是这道题竟然要求是O(n)的,这里面到底有什么玄机呢?
题目特别强调是对一个公司的员工的年龄作排序。员工的数目虽然有几万人,但这几万员工的年龄却只有几十种可能。上班早的人一般也要等到将近二十岁才上班,一般人再晚到了六七十岁也不得不退休。
由于年龄总共只有几十种可能,我们可以很方便地统计出每一个年龄里有多少名员工。举个简单的例子,假设总共有5个员工,他们的年龄分别是25、24、26、24、25。我们统计出他们的年龄,24岁的有两个,25岁的也有两个,26岁的一个。那么我们根据年龄排序的结果就是:24、24、25、25、26,即在表示年龄的数组里写出两个24、两个25和一个26。
想明白了这种思路,我们就可以写出如下代码:
1 void SortAges(int ages[], int length) 2 { 3 4 if(ages == NULL || length <= 0) 5 6 return; 7 8 9 10 const int oldestAge = 99; 11 12 int timesOfAge[oldestAge + 1]; 13 14 15 16 for(int i = 0; i <= oldestAge; ++ i) 17 18 timesOfAge[i] = 0; 19 20 21 22 for(int i = 0; i < length; ++ i) 23 { 24 25 int age = ages[i]; 26 27 if(age < 0 || age > oldestAge) 28 29 throw new std::exception("age out of range."); 30 31 32 33 ++ timesOfAge[age]; 34 35 } 36 37 38 39 int index = 0; 40 41 for(int i = 0; i <= oldestAge; ++ i) 42 { 43 44 for(int j = 0; j < timesOfAge[i]; ++ j) 45 46 { 47 48 ages[index] = i; 49 50 ++ index; 51 52 } 53 54 } 55 56 }
在上面的代码中,允许的范围是0到99岁。数组timesOfAge用来统计每个年龄出现的次数。某个年龄出现了多少次,就在数组ages里设置几次该年龄。这样就相当于给数组ages排序了。该方法用长度100的整数数组辅助空间换来了O(n)的时间效率。由于不管对多少人的年龄作排序,辅助数组的长度是固定的100个整数,因此它的空间复杂度是个常数,即O(1)。
以上转自何海涛博客
《算法导论》中文版第八章第二节 计数排序 里面有关于这个算法的详细讲解。根据算法导论所说,计数排序的一个重要特性就是它的稳定性,上面的算法似乎没有体现出来。根据《算法导论》,我用c++实现了书上的例子。
1 #include <iostream> 2 3 using namespace std; 4 5 void CountingSort(int ages[], int len, int out[], int range) 6 { 7 int *count = new int[range+1]; 8 9 for(int i=0;i<=range;++i) 10 { 11 count[i]=0; 12 } 13 14 for(int i=0;i<len;++i) 15 { 16 count[ages[i]]++; 17 } 18 19 for(int i=1;i<=range;++i) 20 { 21 count[i] += count[i-1]; 22 } 23 24 for (int i=len-1;i>=0;--i) 25 { 26 out[count[ages[i]]-1] = ages[i]; 27 count[ages[i]]--; 28 } 29 30 } 31 32 int main() 33 { 34 const int age_range = 99; 35 36 int a[] = {2,5,3,0,2,3,0,3}; 37 int b[8]; 38 39 CountingSort(a,8,b,age_range); 40 41 for(int i=0;i<8;i++) 42 { 43 cout << b[i] << "\t"; 44 } 45 46 cout << endl; 47 48 system("pause"); 49 50 return 0; 51 }