摘要: LDA代码流程: (1) 先对文档切词,然后对每个词语赋ID编号0~(n-1),计算共有n个词,m个文档 (2) 参数,变量设置: K 主题数 beta β alpha α iter_times 迭代次数 top_words_num 每个主题特征词个数 p,概率向量,double类型,存储采样的临时 阅读全文
posted @ 2018-04-01 17:54 寒杰士 阅读(2435) 评论(0) 推荐(0) 编辑