博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

Hive的架构? 优化?

hdfs + yarn
lzo 压缩 : 减少磁盘空间占用
tez 引擎 : 不是只有MR,更灵活,运算更快
列式存储 :  行转列 text -> parquet

sql explain : join where 先 where 后 join
 hql -> mr : 解析 编译 优化 执行

posted @ 2022-05-29 21:11  CHANG_09  阅读(30)  评论(0编辑  收藏  举报