寻找最大的K个数


给你n个数,让你找出其中最大的K个数。

解法1

很多人上来就对其进行排序,选用不同的排序方法有不同的时间复杂度,这里我们假设使用了最快的快排,时间复杂度为O(n*logn)。通过排序我摘出前K大的数。

但也许快排不是最优的,我们只找最大的K个数,何必要对所有的数进行排序,我们只需要进行局部排序即可,时间复杂度大概是O(N*K)

但快排和局部排序谁优谁劣是并不是一定的,当K大于某个数值时快排的优势就显现出来了,大概是logn吧。

解法2

这个方法是基于快排的,但不是完整的快排。

回忆一下快排,在每一步中,都是将带排数据分成两部分,其中一部分中的任何一个都比另一部分中的任何都大,然后递归排序。

在这里,我们只要在递归过程中选包含最大的K个数的部分进行完整的快排,而对于其他的部分只进行快排的一部分。
    关于使用快排求第K大数的方法参见其他博文。在这个基础上,只需要做小小的改进就可以完成寻找最大K个数的功能了,时间复杂度O(N)

解法3

     以上的两个方法都需要对所有数据遍历多次,如果数据量太大,都没办法全部装进内存了,这时候我们何谈排序。

     其实我们有更优的解决方法,我们可以先拿出K个元素建一个最小堆,然后遍历其他元素,与堆顶的元素进行比较。

有三种情况:

   1  与堆顶元素相同,跳过。

   2  小于堆顶元素,跳过。根据最大堆性质,堆顶是堆中最小的元素,既然都比最小的都小,  肯定不属于最大的K个元素了。

   3  大于堆顶元素, 将其与堆顶元素对换, 然后维护这个堆。

结果遍历所有元素后,我们都得到保存最大K个数的堆,也就到达了我们的目的。


posted @ 2013-06-19 22:18  xindoo  阅读(325)  评论(0编辑  收藏  举报