2017年2月16日
摘要: 、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义 阅读全文
posted @ 2017-02-16 00:32 @ 小浩 阅读(3152) 评论(0) 推荐(0) 编辑
摘要: 说明:Hive之cube、rollup,还有窗口函数,在传统关系型数据(Oracle、sqlserver)中都是有的,用法都很相似。 GROUPING SETS GROUPING SETS作为GROUP BY的子句,允许开发人员在GROUP BY语句后面指定多个统计选项,可以简单理解为多条group 阅读全文
posted @ 2017-02-16 00:15 @ 小浩 阅读(529) 评论(0) 推荐(0) 编辑