06 2014 档案

摘要:LDA是一个关于语料的生成概率模型,基本思想是文档可以表达为隐含主题的随机混合,每个主题刻画为关于词语的分布。LDA假设在语料D中生成一篇文章w的过程如下:1.根据泊松分布选在文章长度N2. 选择主题分布3. 对于每一个词Wn (a)根据多项式分布选择一个主题 (b)根据多项式条件概率分布选... 阅读全文
posted @ 2014-06-16 10:41 范志军 阅读(472) 评论(0) 推荐(0) 编辑