Hive的架构? 优化?
hdfs + yarn
lzo 压缩 : 减少磁盘空间占用
tez 引擎 : 不是只有MR,更灵活,运算更快
列式存储 : 行转列 text -> parquet
sql explain : join where 先 where 后 join
hql -> mr : 解析 编译 优化 执行
hdfs + yarn
lzo 压缩 : 减少磁盘空间占用
tez 引擎 : 不是只有MR,更灵活,运算更快
列式存储 : 行转列 text -> parquet
sql explain : join where 先 where 后 join
hql -> mr : 解析 编译 优化 执行