会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
robin's note
Gotta Be Strong
首页
联系
管理
2017年9月18日
十二道MR习题 – 1 – 排序
摘要: 题目: 一个文件,大小约为100G。文件的每一行都是一个数字,要求对文件中的所有数字进行排序。 对于这个题目,了解过Hadoop的同学可以笑而不语了。即使用spark实现也是非常简单的事情。 先说下如何用Hadoop实现。实际上也没什么好说的:Map任务逐行读入数字,而后在Reduce中输出就可以了,简单粗暴到令人发指。 看下代码好了: package com.zhyea.dev; impor...
阅读全文
posted @ 2017-09-18 07:07 robin·张
阅读(521)
评论(0)
推荐(0)
编辑
公告