2024 年 8月 25 日随笔档案 - INnoVation-V2

2024年8月25日

摘要：一、非并行版本分析 1.非并行版本MapReduce流程通过第一个参数，传入Map和Reduce 函数之后的参数为待处理文件名读取文件调用Map函数，对文件内容进行处理，生成KV对对KV对进行sort 按照Key进行分组，然后对每组数据调用Reduce 将结果写入文件二、Lab思路概述阅读全文

posted @ 2024-08-25 18:11 INnoVation-V2 阅读(15) 评论(0) 推荐(0) 编辑

Lab 1: MapReduce

摘要： Lab 1: MapReduce 目标：实现一个MapReduce系统。其中包含： worker进程：调用Map和Reduce程序并处理文件的读写 coordinator进程：负责将任务分发给worker并处理失败的worker。(注:本Lab使用coordinator而不是论文的master进行管阅读全文

posted @ 2024-08-25 18:10 INnoVation-V2 阅读(11) 评论(0) 推荐(0) 编辑

2.MapReduce论文总结

摘要：一. 介绍很多业务逻辑很简单，主要难点是数据量太大，可使用分布式处理提高速度。传统分布式程序，计算逻辑和分布式任务分发、故障恢复混在一起，原本简单的计算逻辑变得模糊不清，难以处理。 MapReduce将两者分离，任务分发，容错，恢复等逻辑由模型完成，程序员只需要专注计算逻辑。大大了简化代码架构，阅读全文

posted @ 2024-08-25 18:08 INnoVation-V2 阅读(17) 评论(0) 推荐(0) 编辑

1.MapReduce论文翻译

摘要： MapReduce: Simplified Data Processing on Large Clusters（MapReduce: 简化大型集群下的数据处理）作者：Jeffrey Dean and Sanjay Ghemawat Abstract（摘要） MapReduce是一个关于实施大型数据阅读全文

posted @ 2024-08-25 18:08 INnoVation-V2 阅读(19) 评论(0) 推荐(0) 编辑

INnoVation-V2

公告