剑指offer40. Top K

找出数组中最小的k个数。

  1. 排序 ,$nlog(n)$
  2. 维持大小为k的最大堆,$nlog(k)$
  3. 快排思想,期望时间复杂度 $O(n)$,最坏时间复杂度 $O(n^2)$,随机partition会改善最坏的情况 

class Solution {
public:
    int partition(vector<int>& nums, int l, int r) {
        int pivot = nums[r];
        int i = l - 1;
        for (int j = l; j < r; ++j) {
            if (nums[j] < pivot) {
                i++;
                swap(nums[i], nums[j]);
            }
        }
        swap(nums[i + 1], nums[r]);
        return i + 1;
    }
    
    int randomized_partition(vector<int>& nums, int l, int r) {
        int i = rand() % (r - l + 1) + l;
        swap(nums[i], nums[r]);
        return partition(nums, l, r);
    }
    
    void randomized_selected(vector<int>& nums, int l, int r, int k) {
        if (l >= r) return;
        int pos = randomized_partition(nums, l, r);
        int num = pos - l + 1;
        if (k == num) return;
        else if (k < num) randomized_selected(nums, l, pos - 1, k);
        else randomized_selected(nums, pos + 1, r, k - num);
    }
    
    
    vector<int> getLeastNumbers(vector<int>& arr, int k) {
        srand((unsigned)time(NULL));
        randomized_selected(arr, 0, (int)arr.size() - 1, k);
        vector<int> res(arr.begin(), arr.begin() + k);
        return res;
    }
};

 快速选择算法 & 堆

在面试中,另一个常常问的问题就是这两种方法有何优劣。看起来分治法的快速选择算法的时间、空间复杂度都优于使用堆的方法,但是要注意到快速选择算法的几点局限性:

第一,算法需要修改原数组,如果原数组不能修改的话,还需要拷贝一份数组,空间复杂度就上去了。

第二,算法需要保存所有的数据。如果把数据看成输入流的话,使用堆的方法是来一个处理一个,不需要保存数据,只需要保存 k 个元素的最大堆。而快速选择的方法需要先保存下来所有的数据,再运行算法。当数据量非常大的时候,甚至内存都放不下的时候,就麻烦了。所以当数据量大的时候还是用基于堆的方法比较好。

posted @ 2020-04-07 18:35  betaa  阅读(128)  评论(0编辑  收藏  举报