蒙特卡洛法

蒙特卡洛（Monte Carlo）法是一类随机算法的统称。随着二十世纪电子计算机的出现，蒙特卡洛法已经在诸多领域展现出了超强的能力。在机器学习和自然语言处理技术中，常常被用到的MCMC也是由此发展而来。本文通过蒙特卡洛法最为常见的一种应用——求解定积分，来演示这类算法的核心思想。

无意识统计学家法则（Law of the unconscious statistician）

这是本文后续会用到的一个定理。作为一个预备知识，我们首先来介绍一下它。

LOTUS的意思是：已知随机变量X的概率密度函数为 $f_{X}$ ，但不知道g(X)的概率分布，此时用LOTUS公式能计算出函数g(X)的数学期望。LOTUS的公式如下：

其实就是在计算期望时，用已知的X的PDF（或PMF）代替未知的g(X)的PDF（或PMF）。

蒙特卡洛求定积分（一）：投点法

这个方法也常常被用来求π值。现在我们用它来求函数的定积分。如下图所示，有一个函数f(x)，若要求它从 $a$ $a$

注意由蒙特卡洛法得出的值并不是一个精确值，而是一个近似值。而且当投点的数量越来越大时，这个近似值也越接近真实值。

蒙特卡洛求定积分（二）：期望法

下面我们来重点介绍一下利用蒙特卡洛法求定积分的第二种方法——期望法，有时也成为平均值法。

任取一组相互独立、同分布的随机变量{ $X_{i}$ }， $X_{i}$ 在[a, b]上服从分布律 $f_{X}$ ，也就是说 $f_{X}$ $f_{X}$

$f_{X}$

由强大数定理

若选

则依概率1收敛于I，则可以把平均值作为期望I的近似值。

假设要计算的积分有如下形式

其中被积函数g(x) $g (x)$

$g (x)$

如果记

那么原积分可以写作

因而求积分的步骤是：

如果 $a, b$

$a, b$

此时原来的积分式变为

具体步骤如下：

平均值法的直观解释

下面是来自参考文献【1】的一个例子。注意积分的几何意义就是[a,b]区间内曲线下方的面积。

当我们在[a,b]之间随机取一点x时，它对应的函数值就是f(x)，然后变可以用f(x) * (b - a)来粗略估计曲线下方的面积（也就是积分），当然这种估计（或近似）是非常粗略的。

于是我们想到在[a, b]之间随机取一系列点xi时（xi满足均匀分布），然后把估算出来的面积取平均来作为积分估计的一个更好的近似值。可以想象，如果这样的采样点越来越多，那么对于这个积分的估计也就越来越接近。

按照上面这个思路，我们得到积分公式为

注意其中的1/(b - a) $\frac{1}{b - a}$

1. PDF：概率密度函数（probability density function）, 在数学中，连续型随机变量的概率密度函数（在不至于混淆时可以简称为密度函数）是一个描述这个随机变量的输出值，在某个确定的取值点附近的可能性的函数。本身不是概率，取值积分后才是概率。

2. PMF: 概率质量函数（probability mass function), 在概率论中，概率质量函数是离散随机变量在各特定取值上的概率。

3. CDF: 累积分布函数 (cumulative distribution function)，又叫分布函数，是概率密度函数的积分，能完整描述一个实随机变量X的概率分布。是PDF在特定区间上的积分。CDF就是PDF的积分，PDF就是CDF的导数。

转自：https://blog.csdn.net/baimafujinji/article/details/53869358

posted @ 2018-10-03 23:33 coshaho 阅读(20604) 评论(1) 编辑收藏举报

刷新页面返回顶部