会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
IT职场笔记
记录和分享学习笔记
博客园
首页
新随笔
联系
订阅
管理
2015年4月14日
如何解决海量数据的Top K问题
摘要: 1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。 2. 当前解决方案 针对top k类问题
阅读全文
posted @ 2015-04-14 10:30 邴越
阅读(669)
评论(0)
推荐(1)
编辑
公告