摘要: 《LDA数学八卦》对于LDA的Gibbs Sampling求解讲得很详细,在此不在重复在轮子,直接贴上该文这部分内容。 Gibbs Sampling 批注: 1、 对于第i个词语,上式k(主题类型)未知,取值范围为[1, K],t(词语类型)已知,即观测值。 2、 由于doc-topic与topic 阅读全文
posted @ 2018-10-06 11:59 coshaho 阅读(612) 评论(0) 推荐(0) 编辑
摘要: PLSA模型是基于频率派思想的,每篇文档的K个主题是固定的,每个主题的词语概率也是固定的,我们最终要求出固定的topic-word概率模型。贝叶斯学派显然不认同,他们认为,文档的主题未知,主题的词语分布未知,我们无法求解出精确值,只能计算doc-topic概率模型、topic-word概率模型的概率 阅读全文
posted @ 2018-10-06 01:12 coshaho 阅读(1012) 评论(0) 推荐(0) 编辑