Beta分布

用例子理解Bbta分布（一）

Beta分布可以看做是分布之上的分布。我们以抛硬币为例，不过，我们并不假设硬币是均匀的（也就是说：并不假设每次抛硬币，正面朝上的概率为0.5），所以抛硬币的正面朝上的概率p是未知的（只知道p∈[0,1]）。如果进行一次二项分布试验，在这次二项分布试验中，抛硬币10000次，其中正面朝上7000次，反面朝上3000次，我们可以得到，正负面朝上的概率分别为{p,1-p}={0.7,0.3}。但是我们并不确信这个结果是正确的。我们想要做10000次二项分布试验，在每次二项分布试验中，均抛硬币10000次（说不定在其他二项分布实验中，得到的正负面朝上的概率是{0.2,0.8}或者{0.6,0.4}，这些情况都有可能），那么，我们想要知道，在这样的多次重复二项分布实验中，抛硬币最后得到正负面朝上概率为{0.7,0.3}这样概率为多少？这就是在求抛硬币的概率分布之上的分布。这样的分布就叫做Beta分布。正如二项分布可以看做多次进行伯努利试验所得到的分布一样，Beta分布也可以看做是多次进行二项分布的试验所得到的分布，是分布之上的分布。

用例子理解Bbta分布（二）

有一枚硬币（不知道它是否公平），假如抛了三次，三次都是“花”，能够说明它两面都是“花”吗？

1. 贝叶斯推断

按照传统的算法，抛了三次得到三次“花”，那么“花”的概率应该是：P = 3/3 = 100%。但是抛三次实在太少了，完全有可能是运气问题。我们应该怎么办？

贝叶斯认为在实验之前，应根据不同的情况对硬币有所假设。不同的假设会得到不同的推断。

比如和滑不溜手的韦小宝玩。韦小宝可能拿出各种做过手脚的硬币,让我们猜不透,只能假设对硬币一无所知。这种假设之下,我们就只能根据实验结果来猜测。因此，实验结果是“扔三次，三次花”,倾向于认为韦小宝有可能作弊：

大侠陈近南用的可能是公平硬币：

而憨坏的多隆，真的有可能用两面“花”来和你玩：

各种假设称为先验分布，结合刚才“扔三次，三次花”的实验数据，推断出硬币的后验分布，这就是贝叶斯推断：

2.Beta分布

那么问题来了，“先验分布”，“后验分布”用数学怎么表示？对于扔硬币，Beta分布非常适合用来完成这个任务。

2.1 先验分布

Beta分布简记为：Beta（a,b），根据a,b参数的不同，形态各异：

在韦小宝面前，我们对硬币一无所知。贝叶斯说，一无所知也就是意味着任何概率都是一样的，都是有可能的，所以选用均匀分布。Beta(1,1)正好就是均匀分布：

正直的陈近南，可能用的是公平硬币，也就是说概率在0、1之间（0表示“字”，1表示“花”），Beta(5,5,)可以表示这样的分布：

而憨坏的多隆，可能用了两面花，也就是说概率可能集中到1附近，Beta(5,1)可以表示这样的分布：

也就是说可以用Beat 分布来模拟各种先验分布：

一无所知：Beta(1,1)

公平硬币：Beta(5,5)

两面花：Beta(5,1)

2.2 后验分布

用Beta分布来模拟扔硬币的先验分布之后，通过贝叶斯推断，得到的后验分布依然是Beta分布：

具体到这个例子：

再具体到韦小宝的情况就是：

图像上的变化就是：

可以看到，作弊的可能性还是比较大的。

陈近南的情况：

结合试验数据之后，图像的中心从0.5往0.6方向移动了，作弊可能性有所增加，不过总体来看应该还是公平硬币的可能性大。

多隆的情况：

更向1集中，作弊的可能性非常高。

3 代数细节

3.1 贝叶斯推断

贝叶斯推断：

的应用到二项式分布的数学细节如下。假设实验数据 $X|p$ 服从二项分布：

上面的式子根据贝叶斯定理可以表示为：

其中 $k$ 为“花”的次数。分母与实验数据无关，可以视作常数：

因此，写成下面这样更容易看清楚重点（其中 $\propto$ 表示两者之间成比例）：

3.2 Beta分布

3.3 共轭先验

对于二项式分布，用Beta 分布作为先验分布，通过贝叶斯推断之后，后验分布依然是Beta分布：

这种特性称为共轭先验。

参考资料：

伯努利分布、二项分布、Beta分布、多项分布和Dirichlet分布与他们之间的关系，以及在LDA中的应用【存疑】

如何通俗理解 beta 分布？

posted @ 2018-07-20 16:32 小糊涂也学要编程阅读(2380) 评论(0) 编辑收藏举报

努力加载评论中...

刷新页面返回顶部