专注于中国的商业智能

导航

KDT#31 定义实时分区(二)

2.周期快照粒度实时分区

对于周期快照粒度的事实表来说,实时分区相当于该周期内的累计值。即本周期虽然还未结束,但是本周期已内发生的交易的数据已经累计好了。当本周期内发生新的交易时,这个值继续累计,直到本周期结束,写入数据仓库的周期快照事实表中。实时分区中的周期快照事实表也可以全部加载在内存中。

应用程序对实时分区中周期快照的查询和交易粒度的查询不太相同,在统计总数值时,需要将实时分区和数据仓库中的相关的周期快照事实表中的数据相加。

在周期末,可以讲该实时分区中的周期快照事实表中的数据加载到对应的数据仓库中的事实表中,并清空实时分区中的周期快照事实表,准备做下一个周期的数据累计。

3.累计快照粒度实时分区

累计快照粒度的事实表一般用来处理短期业务过程的整个生命周期的数据。数据仓库中的累计快照事实表会随着业务的进行而不断进行更新,当然这种更新只在晚上数据迁移时进行。在实时分区中,累计快照事实表会实时的反映业务系统的信息,并在每天晚上数据迁移时将累计快照数据插入或者更新入数据仓库的相应事实表中。当该业务生命周期结束后,即不需再更新该记录时,将其更新入数据仓库中,并在实时分区中删除。

对实时分区中的累计快照数据进行访问,需要联合数据仓库中的累计快照数据,对于两个地方都存在的数据,以实时分区中的为准。

实时分区中,累计快照粒度的事实表中数据量很小,可以直接加载在内存中,不需要建立索引和聚集。

实时分区是为了满足特殊需求建立的一种结构,用来扩展数据仓库的应用。如果在实时分区的建立中,能够完全放弃索引和聚集,并将数据加载到内存中,就可以得到实时的效果,即更新和查询的效率都很高。

posted on 2010-08-05 13:51  李梦蛟  阅读(378)  评论(0编辑  收藏  举报