会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
阿凯
博客园
首页
新随笔
联系
订阅
管理
2019年12月14日
SimHash算法--文章相似度匹配
摘要: SimHash原理 1.SimHash背景 SimHash算法来自于 GoogleMoses Charikar发表的一篇论文“detecting near duplicates for web crawling” ,其主要思想是降维, 将高维的特征向量映射成低维的特征向量,通过两个向量的Hammin
阅读全文
posted @ 2019-12-14 13:41 是阿凯啊
阅读(3006)
评论(0)
推荐(0)
编辑
公告