会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
吾生也有涯,而知也无涯
心有阳光,正视黑暗
博客园
首页
新随笔
联系
订阅
管理
2019年3月25日
spark mllib lda 简单示例
摘要: 舆情系统每日热词用到了lda主题聚类 原先的版本是python项目,分词应用Jieba,LDA应用Gensim 项目工作良好 有以下几点问题 1 舆情产品基于elasticsearch大数据,es内应用lucene分词,python的jieba分词和lucene分词结果并不一致(或需额外的工作保持一
阅读全文
posted @ 2019-03-25 08:49 cclient
阅读(883)
评论(0)
推荐(0)
编辑
公告