[转]C++11 随机数学习

相对于C++ 11之前的随机数生成器来说,C++11的随机数生成器是复杂了很多。这是因为相对于之前的只需srand、rand这两函数即可获取随机数来说,C++11提供了太多的选择和东西。

 

随机数生成算法:
        随机数生成算法有很多,C++11之前的C/C++只用了一种。C++11则提供下面三种可供选择:

linear_congruential_engine线性同余法
mersenne_twister_engine梅森旋转法
substract_with_carry_engine滞后Fibonacci
        这三种算法,在C++11里面都是用模板的方式实现的。如果我们要使用这三个模板类的话,就必须自己实例化之。但这些实例化参数都是这些算法里面使用到的参数,如果不懂算法的原理的话,真的不知道需要用什么参数才能得到比较好的随机序列。所以我们这些卑微的码农是用不了这些模板类的。C++11标准也想到了这点,所以就帮我们预定义了一些随机数类,这些随机数类都是用比较好的参数实例化上面那三个模板类。注意:在C++11里面,把这些随机数生成器叫做引擎(engines)。

       下图列出了一些实例化的随机数类:

       当然具体用了哪些参数,我们是不用管的,直接用就行了。

       在上图的左上角,还可以看到一个default_random_engine的类。它也是一个实例化的类。之所以不归入那三种算法,是因为它的实现是由编译器厂家决定的,有的可能用linear_congruential_engine实现,有的可能用mersenne_twister_engine实现。这种现象在C/C++中见多了。不过,对于其他的类,C++11是有明确规定用哪种算法和参数实现的。

 

       好了,说了这么多还是上一个例子吧。

#include<iostream>
#include<random>
 
usingstd::cout;
usingstd::endl;
usingstd::cin;
 
intmain()
{
    std::default_random_engine random;
 
    for(int i = 0; i < 20; ++i)
        cout<<random()<<' ';
    cout<<endl;
 
    return 0;
}
//gcc编译器需要加上 –std=c++11 选项。

  

       C++11中,随机数都是定义在random头文件中的。除了default_random_engine,其他的那些实例化随机数类的名字都是怪怪的,所以还是这个好用。从例子中可以看到,是通过operator ()函数来获取下一个随机数。
       对srand熟悉的码农们肯定发现,这里没有使用到随机数种子。其实这里使用了默认种子,默认种子的值可以通过这类的公共静态常量default_seed来获取。如果想为这个类设置自己的种子的话,那么可以通过在构造函数中传入一个参数。也可以在构造之后调用seed()成员函数设置种子。

 

产生均匀分布的随机数:
       上面例子产生的随机数会比较大,如果我们只想产生0到100的随机数。按照我们之前的做法是直接random()%100。这种做法是不好的。原因可以参见《Accelerated C++》的7.4.4节。

        C++11也知道这一点,这就使得C++11的随机数更加复杂了。

       我们平常说产生随机数,隐含是意思是产生均匀分布的随机数。学过概率论的同学都知道,除了均匀分布还有很多分布,比如正态分布、泊松分布等等。之前在网上看过网友怎么用rand()函数产生的随机数制作这些分布。现在这工作不用码农做了,C++11标准都提供了这些分布。

       C++11提供的均匀分布模板类为:uniform_int_distribution和uniform_real_distribution。前一个模板类名字中的int不是代表整型,而是表示整数。因为它是一个模板类,可以用int、long、short等整数类型来实例化。后一个表示浮点数模板类,可以用float和double来实例化。使用例子如下:

#include<iostream>
#include<random>
#include<time.h>
 
using std::cout;
using std::endl;
using std::cin;
 
 
int main()
{
    std::default_random_engine random(time(NULL));
    std::uniform_int_distribution<int> dis1(0, 100);
   std::uniform_real_distribution<double> dis2(0.0, 1.0);
 
    for(int i = 0; i < 10; ++i)
        cout<<dis1(random)<<' ';
    cout<<endl;
 
    for(int i = 0; i < 10; ++i)
        cout<<dis2(random)<<' ';
    cout<<endl;
 
    return 0;
}

  

        可以看到,在uniform_int_distribution的构造函数中,参数说明了随机数的范围。uniform_int_distribution的随机数的范围不是半开范围[  ),而是[  ],对于uniform_real_distribution却是半开范围[  )。也是就是说上面的例子中,能产生100,但不会产生1.0。不得不说,这颠覆了之前的认识。对于default_random_engine来说,其产生的随机数范围是在[min(), max()]之间,其中min()和max()为它的两个成员函数。同样,也是非半开范围。对于浮点数,如果真的是想产生[0.0, 1.0]范围的数,可以使用

#include<cmath>
#include<cfloat>
std::uniform_real_distribution<double> dis2(0, std::nextafter(1,DBL_MAX));

  

        如果uniform_int_distribution使用了无参构造函数,那么其随机数的范围是[0,numberic_limits<type>::max()],也就是0到对应实例化类型能表示的最大值。对于uniform_real_distribution的无参构造函数,则是[0, 1)。

 

mt19937

当你第一眼看到这玩意儿的时候

肯定禁不住吐槽:纳尼?这是什么鬼?

确实,这个东西鲜为人知,但是它却有着卓越的性能

简介

mt19937是c++11中加入的新特性

它是一种随机数算法,用法与rand()函数类似

但是具有速度快,周期长的特点(它的名字便来自周期长度:2^19937-1)

说的直白一点,我们都知道rand()在windows下生成的数据范围为0-32767

但是这个函数的随机范围大概在(maxint,+maxint)(−maxint,+maxint)(maxint为int类型最大值)

实例

这个东西用法非常简单

#include<random>
#include<ctime>
std::mt19937 rnd(time(0));
int main()
{
    printf("%lld\n",rnd());
    return 0;
}

  

 

概率分布类型:
        C++11提供的概率分布类型有下面这些:

 

均匀分布:

       uniform_int_distribution          整数均匀分布

       uniform_real_distribution        浮点数均匀分布

 

伯努利类型分布:(仅有yes/no两种结果,概率一个p,一个1-p)

       bernoulli_distribution    伯努利分布

       binomial_distribution     二项分布

       geometry_distribution    几何分布

       negative_biomial_distribution  负二项分布

 

Rate-based distributions: 

       poisson_distribution 泊松分布

       exponential_distribution指数分布

       gamma_distribution 伽马分布

        weibull_distribution 威布尔分布

       extreme_value_distribution 极值分布

 

正态分布相关:

       normal_distribution        正态分布

       chi_squared_distribution卡方分布

       cauchy_distribution       柯西分布

       fisher_f_distribution      费歇尔F分布

       student_t_distribution t分布

 

分段分布相关:

       discrete_distribution离散分布

       piecewise_constant_distribution分段常数分布

       piecewise_linear_distribution分段线性分布

 

        这些概率分布函数都是有参数的,在类的构造函数中把参数传进去即可。

        下面是一个泊松分布的例子

#include<iostream>
#include<random>
#include<time.h>
#include<iomanip>
 
intmain()
{
  const int nrolls = 10000; // number ofexperiments
  const int nstars = 100;   // maximum number of stars to distribute
 
  int parameter = 4;
 
  std::minstd_rand engine(time(NULL));
  std::poisson_distribution<int>distribution(parameter);
 
  int p[20]={};
 
  for (int i=0; i<nrolls; ++i)
  {
    int number = distribution(engine);
    if (number < 20)
        ++p[number];
  }
 
  std::cout << "poisson_distribution"<<parameter<< std::endl;
  for (int i=0; i < 20; ++i)
    std::cout<<std::setw(2)<< i<< ": " << std::string(p[i]*nstars/nrolls, '*') <<std::endl;
 
  return 0;
}

  

        某一个输出结果为:

 

        可能大家都忘了泊松分布了,看一下下面的图吧

 

 

真正的随机数:
        C++11还提供了一个random_device随机数类。它并不是由某一个数学算法得到的随机序列,而是通过读取文件,读什么文件看具体的实现(Linux可以通过读取/dev/random文件来获取)。文件的内容是随机的,因为文件内容是计算机系统的熵(熵指的是一个系统的混乱程度)。也是当前系统的环境噪声,系统噪音可以通过很多参数来评估,如内存的使用,文件的使用量,不同类型的进程数量等等。Linux的熵来自键盘计时、鼠标移动等。

         不过gcc好像并没有很好地实现这个类,我手里的Mingw4.9.0就不随机,每次运行都得到同样的序列。

 

        对于C++11的随机类的更多用法可以参考这里。

 

        参考:《C++标准库 ——自学教程与参考手册》(第2版)

                   《C++ Primer》(第5版)

                     http://blog.csdn.net/akonlookie/article/details/8223525

                     http://stackoverflow.com/questions/19665818/best-way-to-generate-random-numbers-using-c11-random-library?rq=1

                     http://hipercomer.blog.51cto.com/4415661/857870

posted @ 2019-03-17 15:20  ZYVV  阅读(4814)  评论(0编辑  收藏  举报