2020年1月28日
摘要: 原理流程分析 Map端: 文件存储在HDFS中,每个文件切分成多个一定大小(默认128M)的Block(默认3个备份)存储在多个数据节点上,数据格定义以"\n"分割每条记录,以空格区分一个目标单词。 每读取一条记录,调用一次map函数,然后继续读取下一条记录直到split尾部。 map 输出的结果暂 阅读全文
posted @ 2020-01-28 15:14 Jasongo 阅读(692) 评论(0) 推荐(0) 编辑