摘要: 其实这个题目已经有很多人写过了,数学之美里就有,最近阮一峰的博客里也写了,本文基本上遵循的就是他的思路,只是让其看起来再小白一点点。其实说白了就是用自己的话,再把同样一件事描述一下,顺便扩扩句,把其中跳跃比较大的部分再补充补充。 阮一峰的原文:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 当然虽然题目是比较两篇文章的相似性,但我们也不会傻到真拿两篇篇文章来说明,为了简单起见,我们从句子着手。句子A:周杰伦是一个歌手,也是一个叉叉句子B:周杰伦不是一个叉叉,但是是一个歌手 如何比较相似性呢 ? 第一步分词句子... 阅读全文
posted @ 2013-04-02 15:17 乔伟2024 阅读(14464) 评论(45) 推荐(19) 编辑