会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
百宝箱
博客园
首页
新随笔
联系
订阅
管理
2009年6月18日
转:四种数据ETL模式
摘要: 根据模型的设计和源数据的情况,有四种数据ETL模式: 完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段...
阅读全文
posted @ 2009-06-18 11:35 ???
阅读(213)
评论(0)
推荐(0)
编辑
数据库和数据仓库的区别
摘要: 简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。 数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事...
阅读全文
posted @ 2009-06-18 11:33 ???
阅读(205)
评论(0)
推荐(0)
编辑
公告