2018年9月24日

MapReduce-边数据

摘要: 边数据 边数据(side data)是作业所需的额外的只读数据,以辅助处理主数据集。所面临的挑战在于如何使所有map或reduce任务(这些任务散布在集群内部)都能够方便而高效地使用边数据。 利用Job来配置作业 Configuration类的各种setter方法能够方便地配置作业的任一键值对。如果 阅读全文

posted @ 2018-09-24 15:04 嘣嘣嚓 阅读(228) 评论(0) 推荐(0) 编辑

导航