会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
molearner
做一个简单的求知者,做一个认真的思考者。
博客园
首页
新随笔
联系
订阅
管理
2019年4月13日
文本相似度分析(基于jieba和gensim)
摘要: 基础概念 本文在进行文本相似度分析过程分为以下几个部分进行, 文本分词 语料库制作 算法训练 结果预测 分析过程主要用两个包来实现jieba,gensim jieba:主要实现分词过程 gensim:进行语料库制作和算法训练 结巴(jieba)分词 在自然语言处理领域中,分词和提取关键词都是对文本处
阅读全文
posted @ 2019-04-13 14:23 molearner
阅读(16177)
评论(0)
推荐(0)
编辑