会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Jreey
一片冰心在玉壶
博客园
首页
新随笔
联系
订阅
管理
2018年5月15日
【机器学习】使用gensim 的 doc2vec 实现文本相似度检测
摘要: 环境 Python3, gensim,jieba,numpy ,pandas 原理:文章转成向量,然后在计算两个向量的余弦值。 Gensim gensim是一个python的自然语言处理库,能够将文档根据TF IDF, LDA, LSI 等模型转化成向量模式,gensim还实现了word2vec功能
阅读全文
posted @ 2018-05-15 18:54 Jreey
阅读(14484)
评论(1)
推荐(0)
编辑
公告