08 2018 档案

摘要:前言 下面通过对kylin构建cube流程的分析来介绍cube优化思路。 创建hive中间表 kylin会在cube构建的第一步先构建一张hive的中间表,该表关联了所有的事实表和维度表,也就是一张宽表。 优化点: 1. hive表分区优化,在构建宽表的时候,kylin需要遍历hive表,事实表和维 阅读全文
posted @ 2018-08-15 19:56 ulysses_you 阅读(4126) 评论(0) 推荐(1) 编辑
摘要:前言 本篇文章通过图文的方式分析不同维度组合下的cube在hbase中的存储结构 需要声明的是,kylin不存原始数据,存储cube 全维度构建 假设一张表有3个字段name,age,sex,那么当通过kylin构建这张表的cube时,hbase的表结构如下所示。注意本示例没有度量字段,value表 阅读全文
posted @ 2018-08-08 20:49 ulysses_you 阅读(2493) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示