浅析操作数据存储(三)
Class I的ODS是实时数据仓库的一种实现方式。Class II和Class III的ODS是比较通常的ODS实现方式。Class IV的ODS非常有用的一类ODS实现方式。
在Class IV的ODS中,最为常见的记录就是从数据仓库中总结出来的概况数据(Profile Record)。概况数据是数据情况的大纲。以客户为例,可以总结的概况数据如下:每月买衣服的件数,每周的销售量,每年会看两次眼科医生等等。ODS中的概况数据是从大量的详细数据中总结出来的,大部分是统计和挖掘处理的结果,它们存放到ODS中,供操作人员了解客户的情况。
下面以点击流数据仓库举例来介绍一下Class IV的ODS。
对于基于WEB环境的数据仓库系统来说,建立ODS是一个非常好的选择。WEB的点击流数据经过粒度管理器进入数据仓库,当需要对数据仓库中的数据进行访问时,一般会在数据仓库和WEB环境之间建立ODS,而将数据仓库中概况数据存入ODS中,迁移的频率可以根据具体情况自己来指定。这样,ODS和粒度管理器将数据仓库中的数据与WEB环境进行了隔离,提供给WEB环境高性能的查询。
原文出自Jerome的BI博客,网址是http://www.chinabi.net/blog/user1/lastwood/index.html