会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
waker_wang
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
2018年8月20日
hive调优
摘要:
阅读全文
posted @ 2018-08-20 14:53 waker_wang
阅读(127)
评论(0)
推荐(0)
编辑
hive...
摘要: ORDER BY和SORT BY ORDER BY用于全局排序,就是对指定的所有排序键进行全局排序,使用ORDER BY的查询语句,最后会用一个Reduce Task来完成全局排序。 SORT BY用于分区内排序,即每个Reduce任务内排序。 DISTRIBUTE BY和CLUSTER BY di
阅读全文
posted @ 2018-08-20 11:20 waker_wang
阅读(86)
评论(0)
推荐(0)
编辑
hive分区
摘要: Hive中的表分区 Hive中的表分区比较简单,就是将同一组数据放到同一个HDFS目录下,当查询中过滤条件指定了某一个分区值时候,只将该分区对应的目录作为Input,从而减少MapReduce的输入数据,提高查询效率。 创建分区表 CREATE EXTERNAL TABLE t_1 ( id INT
阅读全文
posted @ 2018-08-20 11:04 waker_wang
阅读(250)
评论(0)
推荐(0)
编辑
公告