随笔分类 - DataWarehouse
摘要:1、concat concat函数在连接字符串的时候,只要其中一个是NULL,那么将返回NULL hive> select concat('a','b'); ab hive> select concat('a','b',null); NULL 2、concat_ws concat_ws函数在连接字符
阅读全文
摘要:如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。 真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于业务部⻔的运营。但是在数据中台构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗
阅读全文
摘要:1、概述 数据仓库中,常见的分层包括ods、dwd、dws、dwt、ads、dim等 2、传统上的数据分层 早期的大数据平台是以hadoop为核心,数据开发也是以MapReduce为主,hive等sql类开发很少见。 因为当数据从多个源头采集上来之后,格式化便成了原始数据。 原始数据经过MapRed
阅读全文
摘要:一、表的分类 1、实体表 实体表,一般是指一个现实存在的业务对象,比如用户,商品,商家,销售员等等。 2、维度表 维度表,一般是指对应一些业务状态,编号的解释表。也可以称之为码表。 比如地区表,订单状态,支付方式,审批状态,商品分类等等。 3、事务型事实表 事务型事实表,一般指随着业务发生不断产生的
阅读全文