(算法)等概率选出m个整数

题目:

从大小为n的整数数组A中随机选出m个整数,要求每个元素被选中的概率相同。

思路:

n选m,等概率情况下,每个数被选中的概率为m/n。

方法:

初始化:从A中选择前m个元素作为初始数组;

随机选择:从第m个元素开始,依次遍历数组下标i,并通过随机生成器生成数字k(生成0~n),如果k<m,则将A[i]替换A[k]。

证明:

归纳法:假设数组A大小为n,需要选m个元素,每个元素被选中的概率为m/n。

对于初始化的m个元素而言,其选中的概率自然为m/n;

而对于第n+1个元素,该元素被选中的概率m/(n+1)(根据随机生成器),

而对于此时前m个元素,根据第n+1个元素的选中与否情况:

第n+1个没选中的概率为1-m/(n+1),则全部留下的可能性为P1:m/n*(1-m/n+1),

第n+1个被选中的概率为m/(n+1)有一个被替换后留下的可能性为P2:m/n*m/(n+1)*(m-1)/m,

总的留下概率为:P1+P2=m/(n+1)

因此得证。

代码:

#include<iostream>
#include<stdlib.h>
#include<time.h>
#include<vector>

using namespace std;

void pickM(const vector<int> &A,int m,vector<int> &pick){
    int n=A.size();
    
    for(int i=0;i<m;i++){
        pick.push_back(A[i]);
    }

    srand((unsigned)time(0));
    for(int i=m;i<n;i++){
        int k=rand()%n;
        if(k<m)
            pick[k]=A[i];
    }
}

int main(){
    int m,n;
    while(cin>>n>>m){
        vector<int> A(n);
        for(int i=0;i<n;i++)
            cin>>A[i];

        vector<int> pick;
        pickM(A,m,pick);        

        for(int i=0;i<m;i++)
            cout<<pick[i]<<" ";
        cout<<endl;
    }
    return 0;
}

 

posted @ 2015-10-25 10:22  AndyJee  阅读(1200)  评论(0编辑  收藏  举报