摘要: MapReduce hdfs用于存储海量数据,mapreduce则用于处理数据,是一种分布式计算模型。MapReduce的思想:将任务切割为多个小任务进行并行计算(Map),然后将得到的局部结果进行汇总(Reduce)。 网络io的耗时远大于磁盘io。当计算程序和数据分别在不同机器上时,将计算程序移 阅读全文
posted @ 2022-05-29 10:51 某某人8265 阅读(117) 评论(0) 推荐(0) 编辑