IntegrationService学习--数据流转换组件2
本篇内容我准备介绍一下IntetrationService中的“渐变维度”组件。
在介绍这个组件怎么使用之前我先说明一下业界通常是怎么处理渐变维度的,教科书上一般叫缓慢变化维
。
下面举个例子说明什么叫做缓慢变化维。
在一个零售业数据仓库中,事实表保存着各销售人员的销售记录,某天一个销售人员从北京分公司调到上
海分公司了,那么如何来保存这个变化呢?也就是说销售人员维度要怎么恰当的处理这一变化。先来回答
一个问题,为什么要处理,或保存这一变化?如果我们要统计北京地区或上海地区的总销售情况的时候,
这个销售人员的销售记录应该算在北京还是算在上海?当然是调离前的算在北京,调离后的算在上海,但
是如标记这个销售人员所属区域?这里就需要处理一下这个维度的数据,即我们缓慢变化维需要做的事情
。
而处理这种缓慢变化维一般都有哪些方法呢?
1.当某个维度成员的数据发生变化时,最新的列值将覆盖以前的维度记录,从而清除了该维度成员的历史
记录;
2.当某个维度成员的数据发生变化时,最新的列值将存储为维度中的新记录,从而提供了一个维度成员的
多个实例,这样便保留了历史记录;
3.当某个维度成员的列数据发生变化,而数据仓库要保留该变化列的最后一个版本时,原始数据将移到该
维度记录的最后一个版本列中,并且所有新维度信息将覆盖现有列.
好了,现在咱们知道了缓慢变化维的常规处理方式,可能有的人已经在大脑里面出现程序的伦敦了,呵呵
,这是程序员的职业病。
各位观众,现在由数据流转换组件中的“渐变维度”出场。
第一步,拖动一个数据流任务到控制流面板,双击来到数据流面板;
第二步,拖动一个一个数据源到数据流面板,设置好维度数据的来源表;
第三步,拖动一个渐变维度组件到数据流面板,并与数据源连线;
第四步,选择数据仓库中的维度表,分别设置输入列,维度列和键类型;(把维度表中对应于数据源中的
主键的字段设置为业务键)
第五步,点击下一步,设置各个维度列的更改类型(有三种类型供选择,固定属性、变化属性和历史属性
)
接下去就点下一步,直到完成。
要是不使用IS,自己编程实现这个渐变维度的话可能还要费上点功夫,但是现在一分钟不到就把这个问题
解决了,感叹一下,IS好强大呀。