摘要: LDA(Latent dirichlet allocation)是有Blei于2003年提出的三层贝叶斯主题模型,通过无监督的学习方法发现文本中隐含的主题信息, 目的是要以无指导学习的方法从文本中发现隐含的语义维度-即“Topic”或者“Concept”。 隐性语义分析的实质是要利用文本中词项(te 阅读全文
posted @ 2018-04-01 19:45 寒杰士 阅读(10396) 评论(0) 推荐(1) 编辑
摘要: LDA代码流程: (1) 先对文档切词,然后对每个词语赋ID编号0~(n-1),计算共有n个词,m个文档 (2) 参数,变量设置: K 主题数 beta β alpha α iter_times 迭代次数 top_words_num 每个主题特征词个数 p,概率向量,double类型,存储采样的临时 阅读全文
posted @ 2018-04-01 17:54 寒杰士 阅读(2435) 评论(0) 推荐(0) 编辑