取样问题(编程珠玑)
c++随机数的产生,参考了某博客,自己也调试了,rand()和srand()之间的联系;
可以认为rand()在每次被调用的时候,它会查看:
1) 如果用户在此之前调用过srand(seed),给seed指定了一个值,那么它会自动调用 srand(seed)一次来初始化它的起始值。
2) 如果用户在此之前没有调用过srand(seed),它会自动调用srand(1)一次。
根据上面的第一点我们可以得出:
1) 如果希望rand()在每次程序运行时产生的值都不一样,必须给srand(seed)中的seed一个变值,这个变值必须在每次程序运行时都不一样(比如到目前为止流逝的时间)。
2) 否则,如果给seed指定的是一个定值,那么每次程序运行时rand()产生的值都会一样,虽然这个值会是[seed, RAND_MAX(0x7fff))之间的一个随机取得的值。
3) 如果在调用rand()之前没有调用过srand(seed),效果将和调用了srand(1)再调用rand()一样(1也是一个定值)。
所以一般就是在使用rand()之前,先初始化随机数种子:
srand((unsigned) time(0));
这里我们要解决的问题:程序的输入包含两个整数m和n,其中m<n。输出是0~n-1范围内m个随机整数的有序列表,不允许重复。
假设m=2,n=5.
if( (bigrand()%5)<2 ),bigrand随机产生很大的随机整数,这里的意思是,大约只有2/5的概率使得这个测试条件成立。
然而这不能保证最后一定能选2个数,可能是一个数,也可能是3个数
代码如下:
int main(int argc, char **argv) { srand((unsigned) time(0)); int m=2; int n=5; for (int i=0; i<n&&m>0; ++i) { if((rand()%5)<2){ cout<<i<<endl; m--; } } }
改进:做完第一次选择之后,若0选中,则选1的概率为1/4,接着若1,2,3都没有选中,那么i=4时,n-i=1,所以余数为0,一定成立,就有两个数产生。
而若0没有选中,则选1的概率为2/4,同理,也能保证选2个数。
int main(int argc, char **argv) { srand((unsigned) time(0)); int m=2; int n=5; for (int i=0; i<n; ++i) { if((rand()%(n-i))<m){ cout<<i<<endl; m--; } } }
改进2:其实就是把产生重复的随机数去掉就行,可以用c++的set集合,若某元素在该集合已经存在,则不插入,否则插入
代码:
int main(int argc, char **argv) { srand((unsigned)time(0)); int m=20; int n=200; set<int> S; //随机产生20个0~200-1范围内的数 while (S.size()<m){ S.insert(rand()%n); } for (set<int>::iterator it=S.begin(); it!=S.end(); ++it) { cout<<*it<<endl; } }