摘要: ETL系统能够:消除数据错误并纠正缺失数据;提供对于数据可信度的文档化衡量;为保护数据获取相互作用的数据流程;把多个源数据整合到一起;将数据进行结构化供最终用户使用。抽取转换加载==〉抽取,清洗,规格化,提交。创建ETL系统的时候,头脑里并存的两条主线:规划&设计主线 和 数据流主线规划&设计主线 :需求和实现===〉架构===〉系统实施===〉测试和发布数据流主线 :抽取===〉清洗====〉规格化====〉提交架构的时候,我们必须作出关于创建ETL系统创建方法的主要的决定,其中包括:1 手工编码还是使用ETL工具 2批处理还是流数据处理 3水平任务依赖还是垂直任务依赖4自动 阅读全文
posted @ 2012-09-11 09:30 honkcal 阅读(893) 评论(0) 推荐(0) 编辑