摘要: MapReduce Hadoop中将数据切分成块存在HDFS不同的DataNode中,如果想汇总,按照常规想法就是,移动数据到统计程序:先把数据读取到一个程序中,再进行汇总。 但是HDFS存的数据量非常大时,对汇总程序所在的服务器将产生巨大压力,并且网络IO也十分消耗资源。 为了解决这种问题,Map 阅读全文
posted @ 2022-05-01 17:03 chester·chen 阅读(445) 评论(0) 推荐(0) 编辑