【Data Structure & Algorithm】 查找最小的k个元素
查找最小的k个元素
题目:输入n个整数,输出其中最小的k个。
例如输入1, 2, 3, 4, 5, 6, 7和8这八个数字,则最小的4个数字为1, 2, 3和4.
分析:这道题最简单的思路是把输入的n个整数排序,这样排在最前面的k个数就是最小的k个数。只是这种思路的时间复杂度为O(nlogn),这当然还有更快的思路。
可以开辟一个长度为k的数组,每次从输入的n个整数中读入一个数,如果数组中已经插入的元素个数少于k个,则将读入的整数直接放到数组中。否则长度为k的数组已经满了,不能再往数组里插入元素,只能替换了。如果读入的这个整数比数组中已有的k个整数的最大值要小,则用读入的这个整数替换这个最大值;如果读入的整数比数组中已有k个整数的最大值还要大,则读入的这个整数不可能是最小的k个整数之一,抛弃这个整数。这种思路相当于只要排序k个整数,因此时间复杂度可以降到O(n+nlogk)。通常情况下k要远小于n,所以这种办法要优于前面的思路。
另外,从上面的分析,当长度为k的数组已经满了之后,如果需要替换,每次替换的都是数组中的最大值。在常用的数据结构中,能够在O(1)时间里得到最大值的数据结构为最大堆,因此可以用堆(heap)来代替数组。此外,在STL中的set和multiset都有堆的实现,直接调用即可。
#include<set> #include<vector> #include<iostream> using namespace std; typedef multiset<int, greater<int>>IntHeap; ////////////////////////////////////////////////// // find k least numbers in a vector ////////////////////////////////////////////////// void FindKLeastNumbers ( constvector<int> & data, //avector of data IntHeap&leastNumbers, //k least numbers,output unsignedint k ) { leastNumbers.clear(); if(k==0|| data.size()<k) return; vector<int>::const_iteratoriter = data.begin(); for(;iter!=data.end(); ++iter) { //ifless than k numbers was inserted into leastNumbers if((leastNumbers.size())<k) leastNumbers.insert(*iter); //leastNumberscontains k numbers and it's full now else { //firstnumber in leastNumbers is the greatest one IntHeap::iteratoriterFirst = leastNumbers.begin(); //ifis less than the previous greatest number if(*iter<*(leastNumbers.begin())) { //replacethe previous greatest number leastNumbers.erase(iterFirst); leastNumbers.insert(*iter); } } } }