会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
工程是一门科学,科学是严谨的。
大圣的笑
Σ(coding(i)*success(i))½
博客园
首页
新随笔
联系
订阅
管理
2017年10月19日
余弦相似性计算【转】
摘要: 句子A:我喜欢看电视,不喜欢看电影。 句子B:我不喜欢看电视,也不喜欢看电影。 请问怎样才能计算上面两句话的相似程度? 基本思路是:如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。 第一步,分词。 句子A:我/喜欢/看/电视,不/喜欢/看/电影。 句子B:
阅读全文
posted @ 2017-10-19 16:38 大圣的笑
阅读(1725)
评论(0)
推荐(0)
编辑
公告