题目描述:给定线性序列集中n个元素和一个整数k,1<=k<=n,要求找出这n个元素中第k小的元素。
题目分析:当k=1时可以看做要找的就是最小的元素;当k=n时,就是要找到最大元素;当k=(n+1)/ 2时,称为找中位数。
思路分析:使用分治算法的思想,随机找一个基准值Key(随机的原因是划分的效率与基准值左右的对称性有关,所以在随机的过程中可以使期望划分是较对
称的)将所有小于Key的值放在集合的左边,大于Key的值放在集合的右边。然后统计在Key左边的元素共有N个。
如果k<=N,则可以判断第k小的元素所处的位置在Key的左边,然后只需要找Key左边的元素第K小的就行了,然后继续随机选择基准值Key,根据基准值划分
集合,一直递归。如果k>N则可以断定此集合中第K小的元素再基准值Key的右边,所以这个时候只需要求Key右边元素的第K-N小的元素即可。经过以上递归
过程最终可以找到该元素。以下附上Java代码做参考使用。
1 package test; 2 import java.util.Random; 3 /** 4 * 线性时间选择问题:找出一个包含n个元素的集合中的第K小的元素 5 */ 6 public class LinerSelect { 7 8 /** 9 * @param args 10 */ 11 public static void main(String[] args) { 12 13 int[] elements={1,5,2,6,8,45,15,26}; 14 System.out.print("原集合为:"); 15 for(int i=0;i<elements.length;i++) 16 { 17 System.out.print(elements[i]+","); 18 } 19 int b=KthMin(elements, 0, 7, 3); 20 System.out.println(); 21 System.out.print("第三小的元素为:"+b); 22 } 23 //寻找第k小的元素 24 public static int KthMin(int[] elements,int start,int end,int k) 25 { 26 if(start==end)return elements[start]; 27 int i=index(elements, start, end); 28 int j=i-start+1;//统计比随机基准值小的元素个数 29 if(k<=j) 30 return KthMin(elements, start, i, k); 31 else { 32 return KthMin(elements, i+1, end, k-j); 33 } 34 } 35 //随机将集合中的元素分为两部分,中间元素。 36 private static int index(int[] elements,int start,int end) 37 { 38 Random random=new Random(); 39 int i=random.nextInt(end-start+1)+start; 40 swap(elements, i, start); 41 return Partition(elements, start, end); 42 } 43 //以第一个元素为基准值将集合分为左右两部分 44 private static int Partition(int[] a,int start,int end) 45 { 46 //i为从开头比较的元素下标,j为从末尾开始的元素下标 47 int i=start+1,j=end; 48 int key=a[start]; 49 while(true) 50 { 51 while(a[i]<key&&i<end) 52 { 53 i++; 54 } 55 while(a[j]>key) 56 { 57 j--; 58 } 59 if(i>=j) 60 break; 61 swap(a, i, j); 62 } 63 a[start]=a[j]; 64 a[j]=key; 65 return j; 66 67 } 68 private static void swap(int[] a,int i,int j) 69 { 70 int temp=a[i]; 71 a[i]=a[j]; 72 a[j]=temp; 73 } 74 }
运行截图:
在将集合基于基准值划分为左右两部分时借鉴了快速排序中的算法思想,在代码中使用方法Partition(int[],int,int)实现。
在此算法中,最坏情况下,算法需要O(n^2)的计算时间。比如当需要寻找最小元素时,但是随机划分一直是从最大的元素开始的。可以将此情况做特殊处理,尽管是不必要的
但是总体来说此算法性能还是不错的。
参考书籍:计算机算法设计与分析(王晓东)