20210423面试题
-- 数仓
1、事实表有哪些?如何理解?
事务型事实表
周期型快照事实表
累积型快照事实表
1、hive 中有哪些文件存储格式,区别?
textfile(默认) parquet(列式存储,以二进制方式存储) orc(列式存储,以二进制方式存储)
-- ORC常用于Hive、Presto;Parquet常用于Impala、Drill、Spark、Arrow;
2、hive如何更改/指定表压缩算法
当Hive将输出写入到表时,输出内容同样可以进行压缩
SET hive.exec.compress.output=true;
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;
3、hive中如何获取所有命令参数?
hive -e 'set;'|grep hive\\.
-----------专注于实时数仓,大数据存储、计算