博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

数据仓库建模:维模型的应用

Posted on 2015-08-25 09:04  徐正柱-  阅读(478)  评论(0编辑  收藏  举报

  确定数据范围实际上是对ODS进行主题划分的过程,这种划分是基于对业务系统的基础上而进行的,并不十分关心整个数据仓库系统上端应用需求,但是需要把上端应用需求与ODS数据范围进行验证,以确保应用所需的数据都已经从业务系统中抽取出来,并且得到了很好的组织。一般来讲,主题的划分是以业务系统的信息模型为依据的,设计者需要综合各种业务系统的信息模型,并进行宏观的归并,得到企业范围内的高层数据视图,并加以抽象,划定几个逻辑的数据主题范围。在这个阶段,以ER模型表示数据主题关系最为恰当。
2:根据数据范围进行进一步的数据分析和主题定义
    在第一步中定义出来了企业范围内的高层数据视图,以及所收集到的各种业务系统的资料,在这一步中,需要对大的数据主题进行分解,并进行主题定义,直到每个主题能够直接对应一个主题数据模型为止。在这个阶段,将把第一步生成的每个ER图中的实体进行分解,分解的结果仍以ER表示为佳。
3:定义主题元素
    定义维、度量、主题、粒度、存储期限
    定义维的概念特性:
    维名称,名称应该能够清晰表示出这个维的业务含义。
    维成员,也就是这个维所代表的具体的数据,
    维层次,维成员之间的隶属与包含的层次关系,每个层次需要定义名称
    定义度量的概念特性:
    度量名称,名称应该能够清晰标书这个度量的业务含义
    定义主题的概念特性:
    主题名称和含义,说明该主题主要包含哪些数据,用于什么分析;
主题所包含的维和度量;
    主题的事实表,以及事实表的数据。
    定义粒度:
    主题中事实表的数据粒度说明,这种粒度可以通过对维的层次限制加以说明,也可以通过对事实表数据的业务细节程度进行说明。  
    定义存储期限:
    主题中事实表中的数据存储周期。
4:迭代,归并维、度量的定义
    在ODS中,因数据来自于多个系统,数据主题划分时虽然对数据概念进行了一定程度上的归并,但具体的业务代码所形成的各个维、以及维成员等还需要进一步进行归并,把概念统一的维定义成一个维,不允许同一个维存在不同的实体表示(象不同的业务系统中一样)。
5:物理实现
    定义每个主题的数据抽取周期、抽取时间、抽取方式、数据接口,抽取流程和规则。
    物理设计不仅仅是ODS部分的数据库物理实现,设计数据库参数、操作系统参数、数据存储设计之外,有关数据抽取接口等问题必须清晰定义。
DW设计指南