先验分布:(一)认识先验概率
一、先验概率的定义
假设有随机变量θ,其取值仅为0或1;另有事件X,其取值仅为a或b。
我们又令当θ = 0时,X = a;当θ = 1时,X = b。也就是说,θ的取值决定了X的取值。
现在,我们做一个游戏,游戏要求我们在不知道θ是多少(0或1)的情况下,估计X的值。
怎么办?由于θ的取值决定了X的取值,只要我们知道θ的取值,问题迎刃而解。
θ可以取0,也可以取1。直观感觉告诉我们,θ有50%的机会等于0,另外50%的机会等于1。
换句话说,在估计X的值之前(不知道X会是多少),我们假设了θ有50%的机会等于0,另外50%的机会等于1。
而这两个50%的概率,就是先验概率。
二、先验概率分布
我们已经知道,先验概率就是在知道结果之前,对原因的概率的估计。要注意的是,这里并不是对原因的估计,而是对原因的概率的估计。
就像上面的例子,在不知道X会是多少的情况下,我们估计θ等于0的概率是50%,θ等于1的概率是50%。
在这个例子中,θ(的取值)服从(0 - 1)分布,也就是:θ要么是0,要么是1,只有两个值,统计学上记为Θ ~ (0 - 1)。
当然,无论出于何种原因,有人会觉得θ有60%的机会等于0,另外40%的机会等于1。
这样可以吗?可以,而且完全合理,因为我们没有任何经验证明θ有多少机会取0,有多少机会取1。
接下来,我们改一下文章一开头的假设:
假设有随机变量θ,其取值为0、1或2;另有事件X,其取值为a、b、c。
我们又令当θ = 0时,X = a;当θ = 1时,X = b;当θ = 2时,X = c。X的取值还是又θ决定。
现在要做的游戏也类似,即在不知道θ是多少(0或1或2)的情况下,估计X的值。
这次我们假设,θ有60%的机会等于0,30%的机会等于1,10%的机会等于3。换言之,这就是在这种假设下的我们主观确定的先验概率分布。要注意的是,我们这里假设X等于某个值的原因只有一个,也就是θ的其中一种取值。
事实上,我们在现实世界中观察到的任何结果都有其背后的原因,就像上面假设中的θ。通常,当我们猜测结果是什么的时候,我们或多或少都假定了一系列原因,而其中的一个或多个原因最终导致了结果。为了方便理解,我们这里先假定,一个事件只由一个原因引起,即原因之间是互斥的。
当原因有很多个,甚至无穷多个的时候,我们应该怎样表示原因的概率(即先验概率)的分布?
当原因有很多个,甚至无穷多个的时候,如果我们人工一个一个主观指定原因的出现概率,将会耗费大量时间,如果原因有无穷多个,则工作根本不可能完成。
先验概率说到底还是概率,我们总能找到一种分布来表示,况且,先验概率是可以由我们主观认定的,也就是说,先验概率有很大的灵活性。因此,我们可以用一种比较灵活的概率分布来表示先验概率的分布。
而用哪种分布往往取决于我们需要解决什么问题。具体讨论见下文:
posted on 2019-05-13 18:20 tspeaking 阅读(5149) 评论(1) 编辑 收藏 举报