算法第二章上机报告
题目:
设计一个平均时间为O(n)的算法,在n(1<=n<=1000)个无序的整数中找出第k小的数。
提示:函数int partition(int a[],int left,int right)的功能是根据a[left]~a[right]中的某个元素x(如a[left])对a[left]~a[right]进行划分,划分后的x所在位置的左段全小于等于x,右段全大于等于x,同时利用x所在的位置还可以计算出x是这批数据按升非降序排列的第几个数。因此可以编制int find(int a[],int left,int right,int k)函数,通过调用partition函数获得划分点,判断划分点是否第k小,若不是,递归调用find函数继续在左段或右段查找。
输入格式:
输入有两行:
第一行是n和k,0<k<=n<=10000
第二行是n个整数
输出格式:
输出第k小的数
输入样例:
在这里给出一组输入。例如:
10 4
2 8 9 0 1 3 6 7 8 2
输出样例:
在这里给出相应的输出。例如:
2
题目分析:
我们可以用快速排序来解决这个问题,先对原数组排序,再返回倒数第 k 个位置,这样平均时间复杂度是 O(nlogn)O(n \log n)O(nlogn),但其实我们可以做的更快。
首先我们来回顾一下快速排序,这是一个典型的分治算法。我们对数组 a[l⋯r]做快速排序的过程是(参考《算法导论》):
分解: 将数组 a[l⋯r]划分成两个子数组 a[l⋯q−1]、a[q+1⋯r],使得 a[l⋯q−1]中的每个元素小于等于 a[q],且 a[q]小于等于 a[q+1⋯r] 中的每个元素。其中,计算下标 q也是划分过程的一部分。
解决: 通过递归调用快速排序,对子数组 a[l⋯q−1]和 a[q+1⋯r]进行排序。
合并: 因为子数组都是原址排序的,所以不需要进行合并操作,a[l⋯r]已经有序。
上文中提到的划分过程是:从子数组 a[l⋯r]中选择任意一个元素 x 作为主元,调整子数组的元素使得左边的元素都小于等于它,右边的元素都大于等于它, x的最终位置就是 q。
由此可以发现每次经过划分操作后,我们一定可以确定一个元素的最终位置,即 x的最终位置为 q,并且保证 a[l⋯q−1]中的每个元素小于等于 a[q],且 a[q] 小于等于 a[q+1⋯r]中的每个元素。所以只要某次划分的 q为倒数第 k个下标的时候,我们就已经找到了答案。 我们只关心这一点,至于 a[l⋯q−1]和 a[q+1⋯r] 是否是有序的,我们不关心。
因此我们可以改进快速排序算法来解决这个问题:在分解的过程当中,我们会对子数组进行划分,如果划分得到的 q 正好就是我们需要的下标,就直接返回 a[q];否则,如果 q比目标下标小,就递归右子区间,否则递归左子区间。这样就可以把原来递归两个区间变成只递归一个区间,提高了时间效率。
#include<cstdio> const int maxn=10010; int partition(int a[], int left, int right){ int base=a[left]; int i=left, j=right, temp; while(i<j){ while(i<j&&a[j]>=base) j--; while(i<j&&a[i]<=base) i++; if(i<j){ temp=a[i]; a[i]=a[j]; a[j]=temp; } } a[left]=a[i]; a[i]=base; return i; } int find(int a[], int left, int right, int k){ int pos = partition(a, left, right); if(pos-left+1== k) return a[pos]; else if(pos-left+1 < k) find(a, pos+1, right, k-pos+left-1); else find(a, left, pos-1, k); } int main(){ int n, k; int a[maxn]; scanf("%d%d", &n, &k); for(int i=0; i<n; i++) scanf("%d", &a[i]); printf("%d", find(a, 0, n-1, k)); }
复杂度分析
- 时间复杂度:O(n)O(n)O(n),如上文所述
心得:求前k个元素是面试常考题,其解决办法不局限于快排,还有堆排等算法,应熟练掌握这类题的解法。另外各大排序算法也应该熟练掌握。