2013年9月28日
摘要: 一、DistributedCache简介 DistributedCache是hadoop框架提供的一种机制,可以将job指定的文件,在job执行前,先行分发到task执行的机器上,并有相关机制对cache文件进行管理. 常见的应用场景有: 分发第三方库(jar,so等);分发算法需要的词典文件;分发程序运行需要的配置;分发多表数据join时小表数据简便处理等 主要的注意事项有: 1.Dist... 阅读全文
posted @ 2013-09-28 23:33 阿笨猫 阅读(6733) 评论(0) 推荐(0) 编辑