• LSA latent semantic analysis

    映射词-文档到一个低维隐语义空间

    比较词和文档在低纬空间的相似性

  •  topic 是 Vocab 上的概率分布(符合多项式分布)
  •  文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型
  • plsa 模型
  • LDA模型
  • 大规模LDA系统
    •   spark LDA
    •       Google PLDA
    •       微软LightLDA
    •       腾讯LDA,PEACOCK