Hive最新常见面试题
1、分区与分桶的区别
2、hive建表demo
create table test11
(
`id` string comment '唯一',
`time` timestamp comment '时间'
)comment '测试表'
partitioned by (dt string comment '分区')
clustered by (id) into 3 buckets
row format delimited fields terminated by '|'
lines terminated by '\n'
stored as orc tblproperties("orc.commpress"="SNAPPY")
;
3、hive底层MapReduce原理
4、hive合并小文件
5、hive如何改变压缩算法
6、4个by的区别
7、hive锁
8、hive数据倾斜
9、hive内部表与外部表区别
10、hive动态插入数据到表多个分区
11、hive表分区生命周期
alter table $db.table set tblproperties ('PARTITION_LIFECYCLE'='40d');
-----------专注于实时数仓,大数据存储、计算