剑指offer40. Top K
找出数组中最小的k个数。
- 排序 ,$nlog(n)$
- 维持大小为k的最大堆,$nlog(k)$
- 快排思想,期望时间复杂度 $O(n)$,最坏时间复杂度 $O(n^2)$,随机partition会改善最坏的情况
class Solution { public: int partition(vector<int>& nums, int l, int r) { int pivot = nums[r]; int i = l - 1; for (int j = l; j < r; ++j) { if (nums[j] < pivot) { i++; swap(nums[i], nums[j]); } } swap(nums[i + 1], nums[r]); return i + 1; } int randomized_partition(vector<int>& nums, int l, int r) { int i = rand() % (r - l + 1) + l; swap(nums[i], nums[r]); return partition(nums, l, r); } void randomized_selected(vector<int>& nums, int l, int r, int k) { if (l >= r) return; int pos = randomized_partition(nums, l, r); int num = pos - l + 1; if (k == num) return; else if (k < num) randomized_selected(nums, l, pos - 1, k); else randomized_selected(nums, pos + 1, r, k - num); } vector<int> getLeastNumbers(vector<int>& arr, int k) { srand((unsigned)time(NULL)); randomized_selected(arr, 0, (int)arr.size() - 1, k); vector<int> res(arr.begin(), arr.begin() + k); return res; } };
快速选择算法 & 堆
在面试中,另一个常常问的问题就是这两种方法有何优劣。看起来分治法的快速选择算法的时间、空间复杂度都优于使用堆的方法,但是要注意到快速选择算法的几点局限性:
第一,算法需要修改原数组,如果原数组不能修改的话,还需要拷贝一份数组,空间复杂度就上去了。
第二,算法需要保存所有的数据。如果把数据看成输入流的话,使用堆的方法是来一个处理一个,不需要保存数据,只需要保存 k 个元素的最大堆。而快速选择的方法需要先保存下来所有的数据,再运行算法。当数据量非常大的时候,甚至内存都放不下的时候,就麻烦了。所以当数据量大的时候还是用基于堆的方法比较好。