摘要: 怎样才能让程序花费的时间最短?Hadoop 是分布式处理系统,可以从两方面进行入手:控制任务的处理数量,使之均衡分布在每个reduce上,不会使哪个任务因为数据量多大而使用过长的时间;增加reduce到一定的数量。 另外的制约因素是tasktracker的负载,一个tasktracker能同时运行多 阅读全文
posted @ 2018-07-12 23:46 大李姗姗 阅读(112) 评论(0) 推荐(0) 编辑