马尔可夫随机场

马尔可夫随机场(Markov Random Field,简称MRF)是典型的马尔可夫网,这是一种著名的无向图模型。图中每个结点表示一个或一组变量,结点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数(potential functions),亦称“因子”(factor),这是定义在变量子集上的非负实函数,主要用于定义概率分布函数。

MRF

图 14.2  一个简单的马尔可夫随机场

图14.2显示出一个简单的马尔可夫随机场。对于图中结点的一个子集,若其中任意两结点间都有边连接,则称该结点子集为一个“团”(clique)。若在一个团中加入另外任何一个结点都不再形成团,则称该团为“极大团”(maximal clique);换言之,极大团就是不能被其它团所包含的团。例如,在图14.2中,\{x_1,x_2\},\{x_1,x_3\},\{x_2,x_4\},\{x_2,x_5\},\{x_2,x_6\},\{x_3,x_5\},\{x_5,x_6\}\{x_2,x_5,x_6\}都是团,并且除了\{x_2,x_5\},\{x_2,x_6\}\{x_5,x_6\}之外都是极大团;但是,因为x_2x_3之间缺乏连接,\{x_1,x_2,x_3\}并不构成团.显然,每个结点至少出现在一个极大团中.

在马尔可夫随机场中,多个变量之间的联合概率分布能基于团分解为多个因子的乘积,每个因子仅与一个团相关.具体来说,对于n个变量\mathrm{x}=\{x_1,x_2,\dots,x_n\},所有团构成的集合为\mathcal{C},与团Q\in\mathcal{C}对应的变量集合记为\mathrm{x_Q},则联合概率分布P(\mathrm{x})定义为

P(\mathrm{x})=\frac{1}{Z}\prod_{Q\in\mathcal{C}}\psi_Q(\mathrm{x_Q})

其中\psi_Q为与团Q对应的势函数,用于对团Q中的变量关系进行建模,Z=\sum\nolimits_x\prod\nolimits_{Q\in\mathcal{C}}\psi_Q(\mathrm{x_Q})为规范化因子,以确保P(\mathrm{x})是被正确定义的概率.在实际应用中,精确计算Z通常很困难,但许多任务往往并不需获得Z的精确值.

显然,若变量个数较多,则团的数目将会很多(例如,所有相互连接的两个变量都会构成团), 这就意味着P(\mathrm{x})会有很多乘积项,显然会给计算带来负担.注意到若团Q不是极大团,则它必被一个极大团Q^*所包含,即\mathrm{x}_Q\subseteq\mathrm{x}_{Q^*};这意味着变量\mathrm{x}_Q之间的关系不仅体现在势函数\psi_Q中,还体现在\psi_{Q^*}中。于是,联合概率P(\mathrm{x})可基于极大团来定义.假定所有极大团构成的集合为\mathcal{C}^*,则有

P(\mathrm{x})=\frac{1}{Z^*}\prod_{Q\in\mathcal{C}^*}\psi_Q(\mathrm{x_Q})

其中Z^*=\sum\nolimits_x\prod\nolimits_{Q\in\mathcal{C}^*}\psi_Q(\mathrm{x}_Q)为规范化因子。例如图14.2中\mathrm{x}=\{x_1,x_2,\dots,x_6\},联合概率分布P(\mathrm{x})定义为

P(\mathrm{x})=\frac{1}{Z^*}\psi_{12}(x_1,x_2)\psi_{13}(x_1,x_3)\psi_{24}(x_2,x_4)\psi_{35}(x_3,x_5)\psi_{256}(x_2,x_5,x_6),

其中,势函数\psi_{256}(x_2,x_5,x_6)定义在极大团\{x_2,x_5,x_6\}上,由于它的存在,使我们不再需为团\{x_2,x_5\},\{x_2,x_6\}\{x_5,x_6\}构建势函数.

在马尔可夫随机场中如何得到”条件独立性”呢?同样借助“分离”的概念,如图 14.3所示,若从结点集A中的结点到B中的结点都必须经过结点集C中的结点,则称结点集A和B被结点集C分离,C称为“分离集”(separating set).对马尔可夫随机场,有

  • “全局马尔可夫性”(global Markov property): 给定两个变量子集的分离集,则这两个变量子集条件独立。

也就是说,图 14.3中若令A,B和C对应的变量集分别为\mathrm{x}_A,\mathrm{x}_B\mathrm{x}_C,则\mathrm{x}_A\mathrm{x}_B在给定\mathrm{x}_C的条件下独立,记为\mathrm{x}_A\perp\mathrm{x}_B|\mathrm{x}_C.

ACB_split

图 14.3  结点集A和B被结点集C分离

为便于讨论,我们令图 14.3中的A, B和C分别对应变量x_A,x_Bx_C,于是图 14.3简化为图 14.4.

temp_ABC

图 14.4  图 14.3的简化版

对于图 14.4,可得联合概率

P(x_A,x_B,x_C)=\frac{1}{Z}\psi_{AC}(x_A,x_C)\psi_{BC}(x_B,x_C).

基于条件概率的定义可得……

P(x_A,x_B|x_C)=P(x_A|x_C)P(x_B|x_C)

x_Ax_B在给定x_C时条件独立。

由全局马尔可夫性可得到两个很有用推论:

  • 局部马尔可夫性(local Markov property): 给定某变量的邻接变量,则该变量条件独立于其他变量。形式化地说,令V为图的结点集,n(v)为结点v在图上的邻接结点,n^*(v)=n(v)\cup\{v\},有\mathrm{x}_v\perp\mathrm{x}_{V\setminus{n^*(v)}}|\mathrm{x}_{n(v)}.
  • 成对马尔可夫性(pairwise Markov property): 给定所有其他变量,两个非临接变量条件独立。形式化地说,令图的结点集和边集分别为VE,对图中的两个结点uv,若\langle{u,v}\rangle\not\in{E},则\mathrm{x}_u\perp\mathrm{x}_v|\mathrm{x}_{v\setminus\langle{u,v}\rangle}.

现在我们来考察马尔可夫随机场中的势函数。显然,势函数\psi_Q(\mathrm{x}_Q)的作用是定量刻画变量集\mathrm{x}_Q中变量之间的相关关系,它应该是非负函数,且在所偏好的变量取值上有较大函数值。例如,假定图 14.4中的变量均为二值变量,若势函数为

则说明该模型偏好变量x_Ax_C拥有相同的取值,x_Bx_C拥有不同的取值;换言之,在该模型中x_Ax_C正相关,x_Bx_C负相关。易知,令x_Ax_C相同且x_Bx_C不同的变量值指派将取得较高的联合概率。

为了满足非负性,指数函数常被用于定义势函数,即

\psi_Q(\mathrm{x}_Q)=e^{-H_Q(\mathrm{x}_Q)}

H_Q(\mathrm{x}_Q)是一个定义在变量\mathrm{x}_Q上的实值函数,常见形式为:

H_Q(\mathrm{x}_Q)=\sum_{u,v\in{Q},u\not=v}\alpha_{uv}x_ux_v+\sum_{v\in{Q}}\beta_vx_v

其中\alpha_{uv}\beta_v是参数.上式中的第二项仅考虑单结点,第一项则考虑每一对结点的关系.

posted on 2016-10-11 15:51  pinweihelai  阅读(2858)  评论(1编辑  收藏  举报