摘要: Big Data Era: 1.More and more data becoming available on Hadoop2.Limitations in existing Business Intelligence (BI) Tools Limited support for Hadoo 阅读全文
posted @ 2017-11-25 21:37 PanPan003 阅读(758) 评论(0) 推荐(0) 编辑
摘要: Kylin is an open source Distributed Analytics Engine from eBay Inc。that provides SQL interface and multi-dimensional analysis (OLAP) on Hadoop support 阅读全文
posted @ 2017-11-25 19:41 PanPan003 阅读(773) 评论(0) 推荐(1) 编辑
摘要: CDH:Cloudera‘s Distribution,including Apache Hadoop. Hadoop众多分支中的一种,可直接用于成产环境 CM:Cloudera Manager 阅读全文
posted @ 2017-11-25 19:35 PanPan003 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 核心思想:预计算。 对多维分析可能用到的度量进行预计算,将计算好的结果保存成Cube,并存在HBase中,供查询时直接访问 将高复杂度的聚合运算、多表连接……操作转换成对预计算结果的查询。决定了Kylin拥有很好的快速查询、高并发能力 理论基础:空间换时间 Cuboid:Kylin中将维度任意组合成 阅读全文
posted @ 2017-11-25 16:09 PanPan003 阅读(6803) 评论(0) 推荐(0) 编辑