Binge-和时间做朋友

2021年6月22日

摘要：数据仓库（Data Houseware）数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，它用于支持企业或组织的决策分析处理。数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库数据仓库用于支持决策，面向分析型数据处理，它不同于企业现有阅读全文

posted @ 2021-06-22 10:11 Binge-和时间做朋友阅读(199) 评论(0) 推荐(0)

Kylin 技术架构（三）

摘要： Kylin 技术架构图 Kylin 系统可以分为在线查询和离线构建两部分离线构建数据源目前主要是 Hadoop、Hive、Kafka和 RDBMS，其中保持着待分析的用户数据 Cube Build Engine（构建引擎）从数据源中抽取数据，并构建 Cube 数据以关系表的形式输入，且必须符合星阅读全文

posted @ 2021-06-22 10:10 Binge-和时间做朋友阅读(199) 评论(0) 推荐(0)

Kylin 工作原理（二）

摘要：什么是 Cube 和 Cuboid 给定一个数据模型，我们可以对其上所有维度进行组合。对于 N 个维度来说，有组合的可能性为 2 的 N 次方种。对每一种维度的组合，将度量做聚合运算，运算的结果保存为一个物理视图，称为 Cuboid。将所有维度组合的 Cuboid 作为一个整体，被称为 Cube。阅读全文

posted @ 2021-06-22 10:08 Binge-和时间做朋友阅读(213) 评论(0) 推荐(0)

Kylin 简介（一）

摘要：什么是 Kylin 官网：http://kylin.apache.org/cn/ Apache Kylin 是 Hadoop/Spark 大数据平台上的一个开源的联机分析处理（OLAP）引擎 Kylin 采用多维立方体预计算技术，实现了超高速的大数据 OLAP 分析，也就是要让大数据分析像使用数据库阅读全文

posted @ 2021-06-22 10:06 Binge-和时间做朋友阅读(419) 评论(0) 推荐(0)

2021年6月15日

数仓建模之聚集型事实表设计案例

摘要：聚集型事实表概念数据仓库的性能是数据仓库建设是否成功的重要标准之一。聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据，可以减少数据库在响应查询时必须执行的工作量，能够快速响应用户的查询，同时有利于减少不同用户访问明细数据带来的结果不一致问题。尽管聚集能带来良好的收益，但需阅读全文

posted @ 2021-06-15 10:21 Binge-和时间做朋友阅读(1132) 评论(0) 推荐(0)

数仓建模之累计快照事实表设计案例

摘要：累计快照事实表的概念累积快照事实表用来表述过程开始和结束之间的关键步骤事件，覆盖过程的整个生命周期，通常具有多个日期字段来记录关键时间点，当过程随着生命周期不断变化时，记录也会随着过程的变化而被修改。设计过程对于累积快照事实表，其建模过程和事务事实表相同，适用于维度建模的步骤。下面详述淘宝阅读全文

posted @ 2021-06-15 10:19 Binge-和时间做朋友阅读(2689) 评论(2) 推荐(0)

数仓建模之周期快照事实表设计案例

摘要：周期快照事实表概念周期快照事实表以具有规律性的、可预见的时间间隔记录事实，时间间隔如每天、每月、每年等，简称“快照事实表” 快照事实表特性用快照采样状态快照事实表以预定的间隔采样状态度量。这种间隔联合一个或多个维度，将被用来定义快照事实表的粒度，每行都将包含记录所涉及状态的事实。现在以淘宝阅读全文

posted @ 2021-06-15 10:18 Binge-和时间做朋友阅读(3049) 评论(0) 推荐(0)

数仓建模之事务事实表设计案例

摘要：事务事实表概念事务事实表用来描述业务过程，跟踪空间或时间上某点的度量事件，保存的是最原子的数据，也称为“原子事实表“ 设计过程任何类型的事件都可以被理解为一种事务。比如交易过程中的创建订单、买家付款，物流过程中的揽货、发货、签收，退款中的申请退款、申请小二介入等，都可以被理解为一种事务。事务事阅读全文

posted @ 2021-06-15 10:17 Binge-和时间做朋友阅读(1400) 评论(0) 推荐(0)

数仓建模之事实表设计

摘要：事实表设计什么是事实表事实表作为数据仓库维度建模的核心，紧紧围绕着业务过程来设计，通过获取描述业务过程的度量来表达业务过程，包含了引用的维度和与业务过程有关的度量。事实表中一条记录所表达的业务细节程度被称为粒度。通常粒度可以通过两种方式来表述：一种是维度属性组合所表示的细节程度一种是所阅读全文

posted @ 2021-06-15 10:15 Binge-和时间做朋友阅读(829) 评论(0) 推荐(0)

2021年6月11日

数仓建模之维度表设计

摘要：什么是维度维度是维度建模的基础和灵魂。在维度建模中，将度量称为“事实” ，将环境描述为“维度”，维度是用于分析事实所需要的多样环境。例如，在分析交易过程时，可以通过买家、卖家、商品和时间等维度描述交易发生的环境。什么是维度属性 **维度所包含的表示维度的列，称为维度属性。**维度属性是查询约束阅读全文

posted @ 2021-06-11 11:19 Binge-和时间做朋友阅读(1011) 评论(0) 推荐(0)

Binge - 和时间做朋友

致力于Java、大数据和人工智能技术培训教育

公告