数据挖掘概念与技术15--为快速高维OLAP预计算壳片段

1. 论数据立方体预计算的多种策略的优弊

  (1)计算完全立方体:需要耗费大量的存储空间和不切实际的计算时间。

  (2)计算冰山立方体:优于计算完全立方体,但在某种情况下,依然需要大量的存储空间和计算时间。

     因为冰山立方体的确定在于最小支持度的确定,所以例如:如果基本立方体单元(a1,.....a60)则,他将至少产生2的60次方个冰山立方体单元;另外最小支持度这个值是难于确定的,小的话将导致巨大的立方体,大的话可能无法用于许多有意义的运用。在实际运用的过程中,应用数据随时间的变化不断增加,之前剪枝的,可能在之后有出现,然而度量确实每次都重新开始计算的。

  (3)计算一个很薄的立方体外壳。大师如果仅仅固定外壳的厚度则,这种立方体不具备高维OLAP,例如:只计算维数小于等于3的数据立方体,那么在计算时候可能只能对该3个维进行运算,而不能进行下钻等。

  所以,对于该情况,取代计算完全外壳的策略,而只计算它的一部分或片段,然后沿该部分维进行高维空间OLAP。即或者首先找到某些感兴趣的方体,然后按照它的一两个维进行下钻,考虑多个维上   

 

posted @ 2017-09-25 21:16  YJ-20  阅读(398)  评论(0编辑  收藏  举报