20210423面试题

-- 数仓

1、事实表有哪些?如何理解?

事务型事实表

周期型快照事实表

累积型快照事实表

 

1、hive 中有哪些文件存储格式,区别?

textfile(默认) parquet(列式存储,以二进制方式存储) orc(列式存储,以二进制方式存储)

-- ORC常用于Hive、Presto;Parquet常用于Impala、Drill、Spark、Arrow;

2、hive如何更改/指定表压缩算法

当Hive将输出写入到表时,输出内容同样可以进行压缩

SET hive.exec.compress.output=true;
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;

3、hive中如何获取所有命令参数?
hive -e 'set;'|grep hive\\.




posted @ 2021-04-25 15:00  再见傅里叶  阅读(57)  评论(0编辑  收藏  举报