08 2015 档案

摘要:分享两篇文章,结合看更清楚一点。背景假设有一个学生各门课的成绩的表单,应用hive取出每科成绩前100名的学生成绩。这个就是典型在分组取Top N的需求。解决思路对于取出每科成绩前100名的学生成绩,针对学生成绩表,根据学科,成绩做order by排序,然后对排序后的成绩,执行自定义函数row_nu... 阅读全文
posted @ 2015-08-12 23:24 LeeZz 阅读(3318) 评论(0) 推荐(0) 编辑
摘要:Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,... 阅读全文
posted @ 2015-08-12 22:54 LeeZz 阅读(489) 评论(0) 推荐(0) 编辑