摘要:
LDA(Latent dirichlet allocation)是有Blei于2003年提出的三层贝叶斯主题模型,通过无监督的学习方法发现文本中隐含的主题信息, 目的是要以无指导学习的方法从文本中发现隐含的语义维度-即“Topic”或者“Concept”。 隐性语义分析的实质是要利用文本中词项(te 阅读全文
摘要:
LDA代码流程: (1) 先对文档切词,然后对每个词语赋ID编号0~(n-1),计算共有n个词,m个文档 (2) 参数,变量设置: K 主题数 beta β alpha α iter_times 迭代次数 top_words_num 每个主题特征词个数 p,概率向量,double类型,存储采样的临时 阅读全文