上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 40 下一页
摘要: 环境准备 Hadoop 3.2.1 Hive 3.1.2 HBase 2.2.7 Zookeeper 3.4.6 安装步骤 上传 apache-kylin-3.1.2-bin-hadoop3.tar.gz 安装包并解压 [root@node-01 ~]# tar -xvzf apache-kylin 阅读全文
posted @ 2021-06-22 10:13 Binge-和时间做朋友 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 数据仓库(Data Houseware) 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,它用于支持企业或组织的决策分析处理。 数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库 数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有 阅读全文
posted @ 2021-06-22 10:11 Binge-和时间做朋友 阅读(148) 评论(0) 推荐(0) 编辑
摘要: Kylin 技术架构图 Kylin 系统可以分为在线查询和离线构建两部分 离线构建 数据源目前主要是 Hadoop、Hive、Kafka和 RDBMS,其中保持着待分析的用户数据 Cube Build Engine(构建引擎)从数据源中抽取数据,并构建 Cube 数据以关系表的形式输入,且必须符合星 阅读全文
posted @ 2021-06-22 10:10 Binge-和时间做朋友 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 什么是 Cube 和 Cuboid 给定一个数据模型,我们可以对其上所有维度进行组合。对于 N 个维度来说,有组合的可能性为 2 的 N 次方种。对每一种维度的组合,将度量做聚合运算,运算的结果保存为一个物理视图,称为 Cuboid。 将所有维度组合的 Cuboid 作为一个整体,被称为 Cube。 阅读全文
posted @ 2021-06-22 10:08 Binge-和时间做朋友 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 什么是 Kylin 官网:http://kylin.apache.org/cn/ Apache Kylin 是 Hadoop/Spark 大数据平台上的一个开源的联机分析处理(OLAP)引擎 Kylin 采用多维立方体预计算技术,实现了超高速的大数据 OLAP 分析,也就是要让大数据分析像使用数据库 阅读全文
posted @ 2021-06-22 10:06 Binge-和时间做朋友 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 聚集型事实表概念 数据仓库的性能是数据仓库建设是否成功的重要标准之一。 聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据,可以减少数据库在响应查询时必须执行的工作量,能够快速响应用户的查询,同时有利于减少不同用户访问明细数据带来的结果不一致问题。尽管聚集能带来良好的收益,但需 阅读全文
posted @ 2021-06-15 10:21 Binge-和时间做朋友 阅读(997) 评论(0) 推荐(0) 编辑
摘要: 累计快照事实表的概念 累积快照事实表用来表述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点, 当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改。 设计过程 对于累积快照事实表,其建模过程和事务事实表相同,适用于维度建模的步骤。 下面详述淘宝 阅读全文
posted @ 2021-06-15 10:19 Binge-和时间做朋友 阅读(2363) 评论(2) 推荐(0) 编辑
摘要: 周期快照事实表概念 周期快照事实表以具有规律性的、可预见的时间间隔记录事实,时间间隔如每天、每月、每年等,简称“快照事实表” 快照事实表特性 用快照采样状态 快照事实表以预定的间隔采样状态度量。这种间隔联合一个或多个维度,将被用来定义快照事实表的粒度,每行都将包含记录所涉及状态 的事实。 现在以淘宝 阅读全文
posted @ 2021-06-15 10:18 Binge-和时间做朋友 阅读(2728) 评论(0) 推荐(0) 编辑
摘要: 事务事实表概念 事务事实表用来描述业务过程,跟踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原子事实表“ 设计过程 任何类型的事件都可以被理解为一种事务。比如交易过程中的创建订单、买家付款,物流过程中的揽货、发货、签收,退款中的申请退款、申请小二介入等,都可以被理解为一种事务。 事务事 阅读全文
posted @ 2021-06-15 10:17 Binge-和时间做朋友 阅读(1258) 评论(0) 推荐(0) 编辑
摘要: 事实表设计 什么是事实表 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度 和与业务过程有关的度量。 事实表中一条记录所表达的业务细节程度被称为粒度。 通常粒度可以通过两种方式来表述: 一种是维度属性组合所表示的细节程度 一种是所 阅读全文
posted @ 2021-06-15 10:15 Binge-和时间做朋友 阅读(685) 评论(0) 推荐(0) 编辑
上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 40 下一页