MapReduce的详细流程
摘要:
不管是maptask还是reducetask 启动以后进程名都叫yarn child由applicationmaster启动上面的yarn child 数据来源由客户端负责划分输入切片:扫描输入目录中的所有文件 遍历每一个文件 按照128M规格划分范围例如一个200M的文件就能划分成两个split, 阅读全文
posted @ 2019-04-01 09:29 哼哈1983 阅读(97) 评论(0) 推荐(0)