摘要: 主题模型 主题模型这样理解一篇文章的生成过程: 1、 确定文章的K个主题。 2、 重复选择K个主题之一,按主题-词语概率生成词语。 3、 所有词语组成文章。 这里可以看到,主题模型仅仅考虑词语的数量,不考虑词语的顺序,所以主题模型是词袋模型。 主题模型有两个关键的过程: 1、 doc -> topi 阅读全文
posted @ 2018-10-05 20:23 coshaho 阅读(5305) 评论(0) 推荐(0) 编辑
摘要: 二维Gibbs Sampling算法 Gibbs Sampling是高维概率分布的MCMC采样方法。二维场景下,状态(x, y)转移到(x’, y’),可以分为三种场景 (1)平行于y轴转移,如上图中从状态A转移到状态B。 (2)平行于x轴转移,如上图中从状态A转移到状态C。 (3)其他情况转移,如 阅读全文
posted @ 2018-10-05 00:15 coshaho 阅读(3268) 评论(0) 推荐(0) 编辑