摘要: 题目: 一个文件,大小约为100G。文件的每一行都是一个数字,要求对文件中的所有数字进行排序。 对于这个题目,了解过Hadoop的同学可以笑而不语了。即使用spark实现也是非常简单的事情。 先说下如何用Hadoop实现。实际上也没什么好说的:Map任务逐行读入数字,而后在Reduce中输出就可以了,简单粗暴到令人发指。 看下代码好了: package com.zhyea.dev; impor... 阅读全文
posted @ 2017-09-18 07:07 robin·张 阅读(520) 评论(0) 推荐(0) 编辑