摘要: 一、数值统计模式 1、求最大值、最小值、总值、个数、平均值 案例:给出用户发帖的第一次时间、最后一次时间、评论总数、帖子平均长度 等。 解决:定义一个 类CaculateObj实现 Writable 接口,以用户ID为Key,在Map/Reduce阶段向HDFS写入的是 CaculateObj 对象 阅读全文
posted @ 2014-12-30 11:55 lihui1625 阅读(139) 评论(0) 推荐(0) 编辑