08 2018 档案
摘要:前言 下面通过对kylin构建cube流程的分析来介绍cube优化思路。 创建hive中间表 kylin会在cube构建的第一步先构建一张hive的中间表,该表关联了所有的事实表和维度表,也就是一张宽表。 优化点: 1. hive表分区优化,在构建宽表的时候,kylin需要遍历hive表,事实表和维
阅读全文
摘要:前言 本篇文章通过图文的方式分析不同维度组合下的cube在hbase中的存储结构 需要声明的是,kylin不存原始数据,存储cube 全维度构建 假设一张表有3个字段name,age,sex,那么当通过kylin构建这张表的cube时,hbase的表结构如下所示。注意本示例没有度量字段,value表
阅读全文