MCMC(一)蒙特卡罗法

---恢复内容开始---

　　作为一种随机采样方法，马尔科夫链蒙特卡罗（Markov chain Monte Carlo，以下简称MCMC）在机器学习，深度学习以及自然语言处理等领域有广泛的应用，是很多复杂算法求解的基础。比如分解机（Factorization Machines）推荐算法，还有前面讲到的受限玻尔兹曼机（RBM）原理总结，都用到了MCMC来做一些复杂的运算的近似求解。下面就对MCMC的原理做一个总结。

1.MCMC概述

　　从名字我我们可以看出，MCMC由两个MC组成，即蒙特卡罗方法（Monte Carlo Simulation，简称MC）。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗发方法和马尔科夫链的原理。我将用三篇来完整地说明MCMC。-------蒙特卡罗法

2.蒙特卡罗方法引入

　　蒙特卡罗原来是一个赌场的名字，用它作为名字的大概是因为蒙特卡罗方法是一种随机模拟方法，这很像赌场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或积分问题。比如积分：

θ=∫baf(x)dx

　　如果我们很难求解出f（x）的原函数，那么这个积分比较难求解。当然我们可以通过蒙特卡罗方法来模拟求解近似值。如何模拟呢？假设我们函数图像如下

　　则一个简单的近似求解方法是在【a，b】之间随机采样一个点。比如x0，然后用f（x0）代表在【a,b】区间上所有的f（x）的值。那么上面的定积分的近似解为：

　　(b−a)f(x0)

　　当然用一个值代表【a,b】区间上所有的f（x）的值，这个假设太粗糙。那么我们可以采样【a，b】区间的n个值：

　　虽然上面的方法可以一定程度上求解出近似的解，但是它隐含了一个假定，即

　　怎么解决这个问题呢？如果我们可以得到

3、概率采样分布

上一节我们讲到蒙特卡罗方法的关键是得到

　　　　对于常见的均匀分布

　　　　其他一些常见的连续分布，比如t分布，F分布，Beta分布，Gamma分布等，都可以通过类似的方式从

　　　　不过很多时候，我们的

　对于概率分布不是常见的分布，一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然

　　　　具体采用过程如下，设定一个方便采样的常用概率分布函数

　　　　首先，采样得到

　　　　整个过程中，我们通过一系列的接受拒绝决策来达到用

5.蒙特卡罗方法小结

使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

　　　　1）对于一些二维分布

　　　　2）对于一些高维的复杂非常见分布

　　　　从上面可以看出，要想将蒙特卡罗方法作为一个通用的采样模拟求和的方法，必须解决如何方便得到各种复杂概率分布的对应的采样样本集的问题。而我们下一篇要讲到的马尔科夫链就是帮助找到这些复杂概率分布的对应的采样样本集的白衣骑士。下一篇我们来总结马尔科夫链的原理。

---恢复内容结束---

posted @ 2019-05-21 10:42 王者or青铜阅读(293) 评论(0) 编辑收藏举报

刷新页面返回顶部

王者or青铜

MCMC(一)蒙特卡罗法

1.MCMC概述

2.蒙特卡罗方法引入

3、概率采样分布

4、接受-拒绝采样

5.蒙特卡罗方法小结

公告