上一页 1 ··· 3 4 5 6 7
摘要: 规范设计在这里取《大数据之路:阿里巴巴大数据实践》中的定义,这里记录一下本人对这一块自己的理解。 规范定义指以维度建模作为理论基础 构建总线矩阵,划分和定义数据域、业务过程、维度、度量 原子指标、修饰类型、修饰词、时间 周期、派生指标。 所谓的规范的定义,简单理解,如果把数据当作货物,那就是货物的分 阅读全文
posted @ 2022-04-20 12:02 张飞的猪 阅读(546) 评论(0) 推荐(2) 编辑
摘要: 目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。 阅读全文
posted @ 2022-04-14 12:03 张飞的猪 阅读(874) 评论(0) 推荐(1) 编辑
摘要: 数据仓库主要有四种架构,Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构,基本上都会使用到维度建模。 <b>Kimball的DW/BI架构</b>,可以参考这篇文章 数据仓库(4)基于维度建模的KimBall架 阅读全文
posted @ 2022-03-31 14:56 张飞的猪 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 如何在centos7中完全卸载Python3?根据查到的资料,主要就是卸载,然后删除一些软连接删除干净,逻辑很简单,贴一些具体的操作代码,记录下来 。 卸载Python3的步骤 #卸载python3 rpm -qa|grep python3|xargs rpm -ev --allmatches -- 阅读全文
posted @ 2022-03-01 19:47 张飞的猪 阅读(531) 评论(0) 推荐(0) 编辑
摘要: 基于维度建模的KimBall架构,将数据仓库划分为4个不同的部分。分别是操作型源系统、ETL系统、数据展现和商业智能应用,如下图。 操作型源系统,指的就是面向用户的各类系统,如app、网站、ERP、CRM等系统。这一块就是我们数据仓库的数据来源,并且这类数据往往有各自的格式和内容,我们同步过来之后, 阅读全文
posted @ 2022-02-23 19:33 张飞的猪 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 维度建模是一种将数据结构化的逻辑设计方法,也是一种广泛应用的数仓建模方式,它将客观世界划分为度量和上下文。度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称之为维度。它与实体-关系建模有很大的区别,实体-关系建模是面向应用,遵循第三范式,以消除数据冗余为目标的 阅读全文
posted @ 2022-02-15 23:11 张飞的猪 阅读(493) 评论(0) 推荐(0) 编辑
摘要: python中,Microsoft Visual C++ 14.0 or greater is required问题解决方案 下面这个就是出现的问题: building 'bitarray._bitarray' extension       error: Microsoft Visual C++ 14.0 or greater is required.  Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/       [end of output], 阅读全文
posted @ 2022-02-10 10:07 张飞的猪 阅读(47209) 评论(1) 推荐(3) 编辑
摘要: 数据仓库(2)数仓、大数据与传统数据库的区别 数据仓库与大数据区别,数据仓库与数据库的区别,大数据与传统数据库的区别 阅读全文
posted @ 2022-02-07 19:28 张飞的猪 阅读(668) 评论(0) 推荐(0) 编辑
摘要: 数据仓库(1)什么是数据仓库,数仓有什么特点 数据仓库,简称数仓,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。这里会介绍涉及的数仓数据开发技术,数仓的作用,数仓的特点等。 阅读全文
posted @ 2022-01-28 17:41 张飞的猪 阅读(1142) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7