蓄水池采样算法

蓄水池采样算法

证明

  • N个元素种随机取m个数;array[N+1]放所有数据,下标从1开始
  • 池子大小m,当前要进入到池子的数据是array[count],count范围[1,N]
  • count <= m时,也就是池子还没满就直接放入
  • count > m 时, 以m/count的概率决定是否要将array[count]放入池子
  • 池子中任意一个元素被array[count]替换的概率是1/m * m/count = 1/count,不被array[count]替换的概率就是1- 1/count=(count-1)/count
  • array[t]会保存在池子里的概率 = P(被选中替换到池子里)P(不被后续的替换) = P(被选中替换到池子里)P(不被array[t+1]替换)P(不被array[t+2]替换)...P(不被array[N]替换)=(m/t)(t/(t+1))((t+1)/(t+2))...*((N-1)/N)=m/N
  • Leetcode:382链表随机节点
/**
 * Definition for singly-linked list.
 * public class ListNode {
 *     int val;
 *     ListNode next;
 *     ListNode() {}
 *     ListNode(int val) { this.val = val; }
 *     ListNode(int val, ListNode next) { this.val = val; this.next = next; }
 * }
 */
class Solution {
//    int[] array;
//
//    public Solution(ListNode head) {
//        List<Integer> list = new ArrayList<>();
//        while (head != null) {
//            list.add(head.val);
//            head = head.next;
//        }
//        array = list.stream().mapToInt(Integer::intValue).toArray();
//    }
//
//    public int getRandom() {
//        return array[new Random().nextInt(array.length)];
//    }

    ListNode head;

    public Solution(ListNode head) {
        this.head = head;
    }

    public int getRandom() {
        ListNode cur = head;
        // 池子容量是1
        // 记录是第几个元素要进入池子
        int count = 0;
        Integer res = null;
        while (cur != null) {
            count++;
            // 小于池子容量时直接放入
            if (res == null) {
                res = cur.val;
            }
            // 大于容量时,以1/count的概率去决定要不要用这个新元素替换池子里的元素
            if (new Random().nextInt(count) == 0) {
                // 换掉池子里的一个任意元素(此题池子为1只有一个元素)
                res = cur.val;
            }
            cur = cur.next;
        }
        return res;
    }
}
posted @ 2022-06-15 11:00  n1ce2cv  阅读(37)  评论(0编辑  收藏  举报