摘要: ETL就是Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合。抽取:就是从源系统抽取需要的数据,这些源系统可以是同构也可以是异构的:比如源系统可能是Excel电子表格、XML文件、关系型数据库,而目标系统通常都是关系型的数据仓库。 转换:源系统的数据按照分析目的, 阅读全文
posted @ 2016-10-09 11:25 捉老鹰的小鸡鸡 阅读(3977) 评论(0) 推荐(0) 编辑
摘要: 原文:《BI项目笔记》增量ETL数据抽取的策略及方法 增量抽取 增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。在ETL使用过程中。增量抽取较全量抽取应用更广。如何捕获变化的数据是增量抽取的关键。对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据按一定的频率准确地捕获到; 阅读全文
posted @ 2016-10-09 11:14 捉老鹰的小鸡鸡 阅读(382) 评论(0) 推荐(0) 编辑