LDA是一种主题模型,它能够将一篇文章的主题以概率分布的形式给出(可以理解为学了一种表示?),有了这个分布之后,便可以进行文本聚类和文本分类。 LDA要做的事情就是根据一篇文档,反推其主题。 共轭的意义在于,分布的先验和后验概率具有同样的形式。 贝叶斯框架: 先验分布(\(p(\theta)\))+数据(似然)=后验分布(\(p(\theta | x)\))