|NO.Z.00017|——————————|BigDataEnd|——|Hadoop&OLAP_Kylin.V17|——|Kylin.v17|Cube优化|检查Cube大小|

一、检查Cube大小
### --- 检查Cube大小

~~~     在Web GUI的Model页面选择一个READY状态的Cube~~~     光标移到该CubeCube Size列时,Web GUI会提示Cube的源数据大小,
~~~     以及当前Cube的大小除以源数据大小的比例,称为膨胀率(Expansion Rate)
### --- 查看cube大小

~~~     一般来说,Cube的膨胀率应该在0%~1000%之间,如果一个Cube的膨胀率超过1000%~~~     那么应当查找其中的原因。
### --- 膨胀率高可能有以下几个方面的原因:

~~~     Cube中的维度数量较多,且没有进行很好的Cuboid剪枝优化,导致Cuboid数量极多
~~~     Cube中存在较高基数的维度(基数的维度是指维度中有多少个不同的值),
~~~     导致包含这类维度的每一个Cuboid占用的空间都很大,这些Cuboid累积造成整体Cube体积变大
~~~     存在占用空间大的度量。
~~~     例如Count Distinct,因此需要在Cuboid的每一行中都为其保存一个较大度量数据,
~~~     最坏的情况将会导致Cuboid中每一行都有数十KB,从而造成整个Cube的体积变大
~~~     对于Cube膨胀率居高不下的情况,需要结合实际数据进行分析,优化。

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

 

posted on   yanqi_vip  阅读(25)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示