05 2019 档案
摘要:OLAP和BI是日常工作中比较熟悉的了,也是经常会接触到的,这里总结下。 这里先说一个概念:数据立方体 我们分析一堆数据报告时候通常这些数据报告采用二维表示,是行与列组成的二维表格。但在我们分析数据的角度很可能有多个,数据立方体可以理解为就是维度扩展后的二维表格。但更多时候数据立方体是多维的,如下图
阅读全文
posted @ 2019-05-29 17:36
codeWan
摘要:ETL这个过程可以说下整套数据流程下来最枯燥也是最耗时间的流程,但是也是最重要的。很多时候我们不缺数据,缺的是好数据,而ETL的结果则导致下游成员的数据质量。 ETL是贯穿数仓的整个环节,不是说只是在某一个地方才使用的。ETL工作的实质就是从各个数据源提取数据,对数据进行转换,并最终加载填充数据到数
阅读全文
posted @ 2019-05-14 15:56
codeWan
摘要:这次总结下维度建模的形式:星型建模,雪花建模,星座模型 (维度建模不需要数据产品去实施,但是需要了解) 先说下两个概念:事实表,维度表 1. 维度表(dimension) 比如"昨天早上我在TB使用了50元购买了一个鞋子"。那么以购买为主题进行分析,可从这段信息中提取三个维度:时间维度(昨天早上),
阅读全文
posted @ 2019-05-06 15:09
codeWan

浙公网安备 33010602011771号