2017 年 9月 18 日随笔档案 - robin·张

2017年9月18日

摘要：题目：一个文件，大小约为100G。文件的每一行都是一个数字，要求对文件中的所有数字进行排序。对于这个题目，了解过Hadoop的同学可以笑而不语了。即使用spark实现也是非常简单的事情。先说下如何用Hadoop实现。实际上也没什么好说的：Map任务逐行读入数字，而后在Reduce中输出就可以了，简单粗暴到令人发指。看下代码好了： package com.zhyea.dev; impor... 阅读全文

posted @ 2017-09-18 07:07 robin·张阅读(521) 评论(0) 推荐(0) 编辑

公告