会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Bohaoist
博客园
首页
新随笔
联系
订阅
管理
2016年4月17日
怎样从10亿查询词找出出现频率最高的10个
摘要: 1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。 2. 当前解决方案 针对top k类问题
阅读全文
posted @ 2016-04-17 22:14 bohaoist
阅读(1720)
评论(0)
推荐(0)
编辑
公告