概率图基础：概率基本概念、条件独立性、图求解联合概率的规则合理性推理

来源：B站up主Shuhuai008：板书

概率图框架：

概率图可分为有向（Bayes Network）和无向（Markov Netwrok），其中从（随机变量服从离散或者连续概率分布）的分类角度可分为高斯图（连续）和其他（离散）。

概率基本概念：

Bayes是一个概率的概念，可从基本的规则推导而来。

边缘概率：p(xi);

条件概率：p(xj | xi);

联合概率：p(x1,x2);

基本规则有如下两个规则：

sum规则：p(x1)=∫p(x1,x2)dx2 【涉及联合概率；边缘概率】

Product规则：p(x1,x2)=p(x1)p(x2|x1)=p(x2)p(x2|x1); 【涉及条件概率；边缘概率】

Chain规则：

p(x1,x2,x3)=p(x1)p(x2|x1)p(x3|x1,x2);

p(x1,x2,…xi)=product_(i=1~p)(p(xi|x1,x2,x_i-1)); （1）

Bayes规则：p(x2|x1)=p(x1,x2)/p(x1)=p(x1,x2)/∫p(x1,x2)dx2=p(x2)p(x1|x2)/∫p(x1,x2)dx2

概率模型求解问题时存在的高维困局：

用概率模型解决问题的时候，求解联合概率是关键的一步，但由于求解复杂问题时，往往随机变量均为高维数据，从chain公式的推导可以看出每一个随机变量的计算，都与它之前的随机变量有关，运算量非常大，那么就存在一个高维困境的问题，这个问题可以通过以下方法解决。

高维困局解决方法（Naive Bayes; Markov;条件独立性）：

首先分析得出，由于随机变量间的条件概率计算繁琐，那么可以假设所有随机变量均为相互独立的变量，达到简化计算的目的，这就是朴素Bayes的思想，那么p(x1,x2,…xi)=product_(i=1~p)(p(xi));。但是这个假设假设得太“过”了，计算出的结果与实际相差甚远，那么就需要想出折中的办法，由此引出了Markov假设（这里只介绍一阶Markov假设）：xj⊥x_i+1 | xi，j<I，在当前状态xi可以被观测的情况下，过去状态xj与未来状态x_i+1条件独立。【一阶Markov假设：因为隐状态是一阶的所以叫一阶Markov假设？】

markov性质示意图（一阶马氏链）

但是Markov假设还是太理想了，所以将其进行推广，得到了条件独立性的假设。在条件独立性中，假设xi分别与一定数量的其他变量相关（需要计算条件概率），而与剩下的变量相互独立，这就引出了“条件独立性”的概念。条件独立性可以用符号表示，a⊥b|c：表示已知c的情况下，a和b相互独立；或者说在c可以被观测的情况下，a和b相互独立。条件独立性是采用chain规则求解联合概率的一种简化手段，为了解决高维困境，较少计算时间提出的。

（2）

引入条件独立性求解联合概率的公式【xpa是“图”中xi父节点的集合】（也可称为联合概率的因子分解形式）

既然条件独立性提出了，那么概率的定义、相关规则、求解手段都具备了。那么现在来说说“概率图”中的“图”。

概率图求解联合概率：

1、解决问题步骤：分析问题=>得出各个状态变量的拓扑排序（父节点/子节点）=>画出概率图=>列出联合概率式子

2、概率图图标、符号解释：

其中，空心圆圈表示状态变量，实心圆圈表示可以被观测到的变量。【由于变量是否可被观测对条件独立性有影响，所以概率“图”中有这样的区分。】，箭头表示状态变量间的关系，在有向图中，箭头表示拓扑关系：p(a);p(b|a)：a是父节点，b是子节点，箭头从父结点指向子节点。

下面介绍怎么用图表示概率、表示条件独立性（由于图是辅助表达的一种手段，所以从图中是一定能比较简便的得到某些信息的，使某些信息更加直观，这也是引入图的目的。在概率图中这个“直观的信息”就是“条件独立性”）。

能够直接用概率图的方法得到联合概率的合理性可从下面①例子解释，①②③分别为Bayes网络的小模块及其条件独立性判断规律（该规律根据逻辑推理总结得到）。

①(tail to tail): b⊥c | a；

若a没被观测，则b与c连通，条件不独立；

若a被观测，则b与c被阻塞，条件独立。

【图中阴影表示状态变量被观测】

图求解规则合理性检验：

【【

：通过验证（1）式和（2）式得出的结果一致，验证概率图求解联合概率的方式可行性。

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b|a)p(c|a)

=> 所以要验证 p(c|a,b)=p(c|a)

=> 两边同乘 p(b|a)得

=> p(c|a,b)p(b|a)=p(c|a)p(b|a) 【左边将a遮掉则较好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,b|a)=p(c|a)p(b|a)

得证： b⊥c | a

】】

②(tail to head): a⊥c | b

若b没被观测，则a与c连通，条件不独立；

若b被观测，则a与c阻塞，条件独立；【<=> p(a,c|b)=p(a|b)p(c|b)】】

【【

图求解规则合理性检验：

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b|a)p(c|b)

=> 所以要验证 p(c|a,b)=p(c|b)

=> 两边同乘 p(a|b)得

=> p(c|a,b)p(a|b)=p(c|b)p(a|b) 【左边将a遮掉则较好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,a|b)=p(c|abp(a|b)

得证： b⊥c | a

】】

③(head to head): a⊥b

若c没被观测，则a与b阻塞，条件独立；【a⊥b】

若c被观测，则a与b连通，条件不独立；

【若d被观测，则a与b连通，条件不独立；】

【【

图求解规则合理性检验：

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b)p(c|a,b)

=> 所以要验证 p(b|a)=p(b)

=> 两边同乘 p(a)得

=> p(b|a)p(a)=p(b)p(a) 【左边将a遮掉则较好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(a,b)=p(b)p(a)

得证： a⊥b

】】

问题：

一阶Markov假设的一阶体现在哪儿？状态变量为一阶？变量一阶体现在？

混合模型的混合体现在哪儿？体现在有可观测变量和隐变量么？

完备数据是什么？非隐变量模型？

Bayes 用途？用于分类？

什么是概率图的连通，指的是状态变量的概率之间会相互影响？

参考资料：https://www.bilibili.com/video/BV1BW41117xo?p=1 ，作者：shuhuai008

posted @ 2020-07-04 10:58 Feynmania 阅读(2670) 评论(0) 编辑收藏举报

刷新页面返回顶部

概率图基础：概率基本概念、条件独立性、图求解联合概率的规则合理性推理

公告