LDA Gibbs Smapling理解

即排除当前词的主题分配,根据其他词的主题分配和观察到的单词来计算当前词主题的概率公式

里面用到了伽马函数的性质

当Gibbs sampling 收敛后,我们需要根据最后文档集中所有单词的主题分配来计算,作为我们估计出来的概率图模型中的隐含变量。每个文档上Topic的后验分布和每个Topic下的term后验分布如下

我们可以得到两个Multinomial分布的参数的计算公式如下(当没收敛时,也是这样计算的)

posted @ 2018-12-18 16:09  下路派出所  阅读(269)  评论(0编辑  收藏  举报