等概率随机函数的实现

利用等概率函数Rand5产生等概率函数Rand3

问题描述：现在有一个叫做Rand5的函数，可以生成等概率的[0, 5)范围内的随机整数，要求利用此函数写一个Rand3函数（除此之外，不能再使用任何能产生随机数的函数或数据源），生成等概率的[0, 3)范围内的随机整数。

//使用Rand5()实现Rand3()   
int Rand3()  
{  
    int x;  
    do  
    {  
        x = Rand5();  
    } while (x >= 3);  
    return x;  
}  
  
//利用Rand3编写Rand5怎么办？   
int Rand5()  
{  
    int x;  
    do  
    {  
        x = Rand3() * 3 + Rand3();  
    } while (x >= 5);  
    return x;  
}   
  
//如果要求利用Rand5编写Rand7怎么办？   
int Rand7()  
{  
    int x;  
    do  
    {  
        x = Rand5() * 5 + Rand5();  
    } while (x >= 21);  
    return x % 7;  
}

数学证明详情：http://www.gocalf.com/blog/build-rank3-from-rand5.html

题目：已知有个rand7()的函数，可以生成等概率的[1,7]范围内的随机整数，让利用这个rand7()构造rand10()函数，生成等概率的[1,10]范围内的随机整数。

分析：要保证rand10()在整数1-10的均匀分布，可以构造一个1-10*n的均匀分布的随机整数区间（n为任何正整数）。假设x是这个1-10*n区间上的一个随机整数，那么x%10+1就是均匀分布在1-10区间上的整数。由于(rand7()-1)*7+rand7()可以构造出均匀分布在1-49的随机数（原因见下面的说明），可以将41～49这样的随机数剔除掉，得到的数1-40仍然是均匀分布在1-40的，这是因为每个数都可以看成一个独立事件。

下面说明为什么(rand7()-1)*7+rand7()可以构造出均匀分布在1-49的随机数:
首先rand7()-1得到一个离散整数集合{0，1，2，3，4，5，6}，其中每个整数的出现概率都是1/7。那么(rand7()-1)*7得到一个离散整数集合A={0，7，14，21，28，35，42}，其中每个整数的出现概率也都是1/7。而rand7()得到的集合B={1，2，3，4，5，6，7}中每个整数出现的概率也是1/7。显然集合A和B中任何两个元素组合可以与1-49之间的一个整数一一对应，也就是说1-49之间的任何一个数，可以唯一确定A和B中两个元素的一种组合方式，反过来也成立。由于A和B中元素可以看成是独立事件，根据独立事件的概率公式P(AB)=P(A)P(B)，得到每个组合的概率是1/7*1/7=1/49。因此(rand7()-1)*7+rand7()生成的整数均匀分布在1-49之间，每个数的概率都是1/49。

int rand_10()    
{    
    int x = 0;    
    do    
    {    
        x = 7 * (rand7() - 1) + rand7();    
    }while(x > 40);    
    return x % 10 + 1;    
}

注：为什么用while(x>40)而不用while(x>10）呢？原因是如果用while(x>10）则有40/49的概率需要循环while，很有可能死循环了。

归纳总结：将这个问题进一步抽象，已知random_m()随机数生成器的范围是[1, m] 求random_n()生成[1, n]范围的函数，m < n && n <= m *m

int random_n()    
{    
    int val = 0;    
    int t;   //t为n的最大倍数，且满足t<m*m      
    do    
    {    
        val = m * (random_m() - 1) + random_m();    
    }while(val > t);    
    return val % n + 1;    
}

题目：已知随机函数rand()，以p的概率产生0，以1-p的概率产生1，现在要求设计一个新的随机函数newRand()，使其以1/n的等概率产生1~n之间的任意一个数。

解决思路：可以通过已知随机函数rand()产生等概率产生0和1的新随机函数Rand()，然后调用k（k为整数n的二进制表示的位数）次Rand()函数，得到一个长度为k的0和1序列，以此序列所形成的整数即为1--n之间的数字。注意：从产生序列得到的整数有可能大于n，如果大于n的话，则重新产生直至得到的整数不大于n。
第一步：由rand()函数产生Rand()函数，Rand()函数等概率产生0和1
第二步：计算整数n的二进制表示所拥有的位数k，k = 1 +log2n（log以2为底n）
第三步：调用k次Rand()产生随机数，产生的k个01序列表示1-n之间的数

int Rand()    
{    
    int i1 = rand();    
    int i2 = rand();    
    if(i1==0 && i2==1)    
        return 1;    
    else if(i1==1 && i2==0)    
        return 0;    
    else    
        return Rand();    
    return -1;    
}  
int newRand()    
{    
    int result = 0;    
    for(int i = 0 ; i < k ; ++i)    
    {    
        if(Rand() == 1)    
            result |= (1<<i);    
    }    
    if(result > n)    
        return newRand();    
    return result;    
}