力扣398-随机数索引-(蓄水池抽样算法)
https://leetcode-cn.com/problems/random-pick-index/
给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。
注意:
数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。
示例:
int[] nums = new int[] {1,2,3,3,3};
Solution solution = new Solution(nums);
// pick(3) 应该返回索引 2,3 或者 4。每个索引的返回概率应该相等。
solution.pick(3);
// pick(1) 应该返回 0。因为只有nums[0]等于1。
solution.pick(1);
重述题意:求一个数a在数组中等可能出现的下标idx是多少?
(1)竞赛思维
追求时间不追求空间,对每一个开一个可变长数组来存储,例如C++中的vector(如果a太大,用map映射到邻接表的一维下标,数组长度总不可能超过map的大小),存储a的各个出现的下标,然后rand()%length即所求的下标。概率是相等的。
效率分析:预处理时间复杂度0(n),空间复杂度O(n),对于多个pick操作都可以在O(1)求得。
(2)面试思维
本题追求空间不追求时间,每遇见一个a,计数cnt+1,然后判断随机数r%cnt是否等于0,如果等于就把答案idx赋值为当前答案。这就是所谓的蓄水池抽样算法,验证一下概率的等可能性。
- 如果只有1个数,概率是1
- 如果只有2个数,概率是1/2
- 如果只有3个数,概率是1/3
- ...
- 如果只有(n-1)个数,概率是1/(n-1)
- 如果只有n个数,概率是1/n
从第n个等于a的数逆推
- 遇到第n个数时,cnt加到n了,r%n==0的概率是1/n,第n个idx被选中的概率是1/n
- 回溯到第n-1个数时,cnt=n-1,r%(n-1)==0的概率是1/(n-1),判断第n-1个idx被选中的概率是1/(n-1)
- ...
- 回溯到第2个数时,cnt=2,r%2==0的概率是1/2,判断第2个idx被选中的概率是1/2
- 回溯到第1个数时,cnt=2,r%1==0的概率是1,判断第1个数idx被选中的概率是1
把前m个数和第m+1个数分离,前m个数自己去算概率,遇到第m+1个数时,只要求第m+1个数的概率。
效率分析:空间复杂度O(1),每次pick的时间复杂度是0(n),如果有m个pick操作,时间复杂度是O(n*m)
class Solution { static int[] nums; public Solution(int[] nums) { this.nums=nums; } public int pick(int a) { Random r=new Random(); int cnt=0; int ans=-1; for(int i=0;i<nums.length;i++){ if(a==nums[i]){ cnt++; if(r.nextInt()%cnt==0) ans=i; } } return ans; } } /** * Your Solution object will be instantiated and called as such: * Solution obj = new Solution(nums); * int param_1 = obj.pick(target); */