摘要: Hive背景介绍 Hive最初是Facebook为了满足对海量社交网络数据的管理和机器学习的需求而产生和发展的。互联网现在进入了大数据时代,大数据是现在互联网的趋势,而hadoop就是大数据时代里的核心技术,但是hadoop的mapreduce操作专业性太强,所以facebook在这些基础上开发了h 阅读全文
posted @ 2018-05-12 16:03 子墨言良 阅读(17870) 评论(0) 推荐(2) 编辑
摘要: 项目介绍 本项目我们使用明星搜索指数数据,分别统计出搜索指数最高的男明星和女明星。 数据集 明星搜索指数数据集,如下图所示。猛戳此链接下载数据集 思路分析 基于项目的需求,我们通过以下几步完成: 1、编写 Mapper类,按需求将数据集解析为 key=gender,value=name+hotInd 阅读全文
posted @ 2018-05-12 11:02 子墨言良 阅读(796) 评论(0) 推荐(0) 编辑