Hive insert overwrite 和 insert into
今天和大家唠唠平时使用 insert 往 hive 表 插入数据的两种方式,针对分区表和非分区表的的效果不太一样,下面分开进行说明
1、分区表
insert overwrite table dwa_db.temp_test_part partition (part_id='0') select ... from ...
这里是将 表 part_id=‘0’ 的分区数据删除后,将查询语句的结果数据插入当前part_id=‘0’ 分区。
insert into table dwa_db.temp_test_part partition (part_id='0') select ... from ...
这是直接将查询结果数据追加到 part_id='0' 所在分区,原有数据不变,只是追加了一些数据
2、非分区表
insert overwrite table dwa_db.temp_test select ... from ...
将 dwa_db.temp_test 数据删除,然后将查询出的数据插入到表里。
insert into table dwa_db.temp_test select ... from ...
表里的数据不删除,然后追加新的查询数据。