专注于中国的商业智能

导航

KDT#3 不要建立部门级的数据集市

这个题目一定会给人带来概念上的混淆。市面上大部分关于数据仓库的书中讲述的都是数据集市是部门级的,而数据仓库是企业级的。

这里有一个概念需要单独说明一下,这个概念就是数据集市(Data Mart)。关于数据集市的概念还没有统一的定论。前面提到的面向部门级的数据集市是InmonCIF架构中的概念。而KimballMD架构中数据集市和CIF架构中的数据集市的概念是不一样。这个区别不是一两句话能说清的,改天单写一个文档好了。

本技巧中Kimball讲述的是数据集市应该是关注于业务处理过程(Business Process)的,而不应该关注于业务部门(Business Departments)。举例来说,目前很多建立的部门级的数据集市,如“市场数据集市”、“销售数据集市”和“财务数据集市”等。当你仔细看过它们的业务需求后,你会发现它们的核心需求都是一样的,比如说订单数据,这时,我们真正需要定义的应该是可以供多个部门访问的“订单数据集市”。这样可以避免同样的数据复制到多个地方,而数据流向的复杂就很容易产生不一致的现象。

当然,在建立数据集市时需要使用一致性维度(conformed dimension)和总线矩阵(bus matrix)。

posted on 2010-08-05 13:54  李梦蛟  阅读(467)  评论(0编辑  收藏  举报