|NO.Z.00015|——————————|BigDataEnd|——|Hadoop&OLAP_Kylin.V15|——|Kylin.v15|Cube优化|Cuboid剪枝优化|

一、Cube优化
### --- Cuboid剪枝优化

~~~     Cuboid 特指 Kylin 中在某一种维度组合下所计算的所有数据。
~~~     以减少Cuboid数量为目的的优化统称为Cuboid剪枝。
### --- 在没有采取任何优化措施的情况下,Kylin会对每一种维度的组合进行预计算。

~~~     如果有4个维度,可能最终会有 2^4 =16个 Cuboid需要计算
~~~     如果有10个维度,那么没有经过任何优化的Cube就会存在 2^10 =1024 个Cuboid
~~~     如果有20个维度,那么Cube中总共会存在 2^20 = 1,048,576 个 Cuboid
### --- 过多的 Cuboid 数量对构建引擎、存储引擎压力非常巨大。

~~~     因此,在构建维度数量较多的Cube时,尤其要注意Cube的剪枝优化。
~~~     Cube的剪枝优化是一种试图减少额外空间占用的方法,这种方法的前提是不会明显影响查询时间。
### --- 在做剪枝优化的时候:

~~~     需要选择跳过那些“多余”的Cuboid
~~~     有的Cuboid因为查询样式的原因永远不会被查询到,因此显得多余
~~~     有的Cuboid的能力和其他Cuboid接近,因此显得多余
~~~     Kylin提供了一系列简单的工具来帮助他们完成Cube的剪枝优化

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

 

posted on   yanqi_vip  阅读(51)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示