摘要: 1.执行参数优化 --分区 SET hive.exec.dynamic.partition=true; SET hive.exec.dynamic.partition.mode=nonstrict; set hive.exec.max.dynamic.partitions.pernode=10000 阅读全文
posted @ 2022-12-16 02:50 空归 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 一、临时表创建技巧: drop view mytab2; create or replace view mytab2 as select 1 as c1 union all select 2 as c1 union all select 3 as c1 ; --1、子查询 select * , c1 阅读全文
posted @ 2022-12-16 02:00 空归 阅读(674) 评论(0) 推荐(0) 编辑
摘要: 数仓基本介绍 数仓四大特征: 1> 面向主题:要分析的需求是什么,对应的主题是什么; 2> 集成性; 3> 非易失性:存储的都是过去既定发生的数据,不会再进行更改; 4> 时变性:随时间推移,数据需要增加最新的相关的数据,同时分析手段也会发生变化; 数据仓库与数据集市区别: 数据仓库:将公司中所有的 阅读全文
posted @ 2022-12-16 01:29 空归 阅读(288) 评论(0) 推荐(0) 编辑