摘要: MapReduce常见算法 单词计数 数据去重 排序 Top K 选择 以求最值为例,从100万数据中选出一行最小值 投影 以求处理手机上网日志为例,从其11个字段选出了五个字段(列)来显示我们的手机上网流量 分组 相当于分区,以求处理手机上网日志为例,喊手机号和非手机号分为两组 多表连接 单表关联 阅读全文
posted @ 2017-04-03 11:57 ahu-lichang 阅读(964) 评论(0) 推荐(0) 编辑