随笔分类 -  DataWarehouse

摘要:1、concat concat函数在连接字符串的时候,只要其中一个是NULL,那么将返回NULL hive> select concat('a','b'); ab hive> select concat('a','b',null); NULL 2、concat_ws concat_ws函数在连接字符 阅读全文
posted @ 2020-09-02 15:46 hyunbar 阅读(795) 评论(0) 推荐(0) 编辑
摘要:如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。 真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于业务部⻔的运营。但是在数据中台构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗 阅读全文
posted @ 2020-08-17 13:51 hyunbar 阅读(286) 评论(0) 推荐(0) 编辑
摘要:1、概述 数据仓库中,常见的分层包括ods、dwd、dws、dwt、ads、dim等 2、传统上的数据分层 早期的大数据平台是以hadoop为核心,数据开发也是以MapReduce为主,hive等sql类开发很少见。 因为当数据从多个源头采集上来之后,格式化便成了原始数据。 原始数据经过MapRed 阅读全文
posted @ 2020-06-23 11:04 hyunbar 阅读(2374) 评论(0) 推荐(0) 编辑
摘要:一、表的分类 1、实体表 实体表,一般是指一个现实存在的业务对象,比如用户,商品,商家,销售员等等。 2、维度表 维度表,一般是指对应一些业务状态,编号的解释表。也可以称之为码表。 比如地区表,订单状态,支付方式,审批状态,商品分类等等。 3、事务型事实表 事务型事实表,一般指随着业务发生不断产生的 阅读全文
posted @ 2019-11-18 19:10 hyunbar 阅读(636) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示