数据仓库特性中主题的困惑?

在卡尔恩门的定义中,数据仓库包含4个特性,分别为:面向主题的、集成的、相对稳定的、反应历史变化的,不过对于其中面向主题具体是什么意思并不是很理解,问题主要集中于,从源系统中导入的数据在面向主题与不面向主题时有什么分别?仔细研究后再做记录。

 

最近看了一些资料,先将最新理解记录下来

 

面向主题主要是有两个作用:

1、便于开发以及业务人员理解表的范围,将每个表放在一个主题下面,便于我们查看,像图书馆也将每种图书分类放在一起。

2、相对于集成而言,特性中的集成表示将多个源系统中的数据放到一起,仅是物理上他们的数据都在数据仓库这个大数据库中,面向主题就相当于将不同源系统的数据进行面向主题的整合,例如我们已阿里巴巴为例,假设淘宝与支付宝有两个数据库,均有各自的用户表,整合到数据仓库中我们往往针对客户主题将两个源系统的用户表在数据仓库中合并为一张大的用户表,这样更容易集中分析。

 

总的来说概念只是一种提炼性的描述,往往为了描述的准确性、简短性,而牺牲了可读性,更重要的是看到结果是什么样子再去看概念就知道为何要如此描述了。

posted @ 2015-07-13 14:48  问悟  阅读(982)  评论(0编辑  收藏  举报