摘要: hadoopMapReduce 1. MapReduce流程 2. Shuffle流程 1. MapReduce流程 MapReduce流程 切片: 对数据进行逻辑划分,默认大小是一个block块大小. 以文件为单位,所以注意小文件问题 计算规则:Math.max(minSize, Math.min 阅读全文
posted @ 2019-06-07 22:43 林宇风 阅读(180) 评论(0) 推荐(0) 编辑
摘要: hadoophdfs 1. HDFS写流程 2. HDFS写流程 1. HDFS写流程 HDFS写流程 副本存放策略: 上传的数据块后,触发一个新的线程,进行存放。 第一个副本:与client最近的机器(基于性能考虑) 第二个副本:跨机器存放该副本(考虑数据安全性) 第三个副本:与第一个,第二个副本 阅读全文
posted @ 2019-06-07 22:41 林宇风 阅读(173) 评论(0) 推荐(0) 编辑