会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
ahu-lichang
博客园
首页
新随笔
联系
管理
订阅
2017年4月3日
MapReduce常见算法
摘要: MapReduce常见算法 单词计数 数据去重 排序 Top K 选择 以求最值为例,从100万数据中选出一行最小值 投影 以求处理手机上网日志为例,从其11个字段选出了五个字段(列)来显示我们的手机上网流量 分组 相当于分区,以求处理手机上网日志为例,喊手机号和非手机号分为两组 多表连接 单表关联
阅读全文
posted @ 2017-04-03 11:57 ahu-lichang
阅读(964)
评论(0)
推荐(0)
编辑
公告