会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
老兵笔记-郑昀
参与软件开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。
你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨,知无不言言无不尽。
订阅
管理
2012年6月12日
短文本合并重复(去重)的简单有效做法
摘要: 先介绍一下SimHash处理短文本合并重复的效果,再介绍一下2009年2月份我们做Twitter锐推榜时是如何做的。
阅读全文
posted @ 2012-06-12 18:05 老兵笔记
阅读(16862)
评论(0)
推荐(0)
编辑
公告