新随笔  :: 订阅 订阅  :: 管理

2018年6月26日

摘要: 早期, ETL知识作为BI系统的一部分来介绍. 后来在The Data Warehouse ETL Tooket一书中, 系统性的整理了ETL的相关内容, 形成了一篇"ETL里的34个子系统"的介绍, 总结了ETL项目面临的不同任务. 安装类型分类其实主要分为:1抽取 对应原文子系统1~32清洗更正 对应原文4~83发布 34个子系统有13个属于这个范畴4管理 对应原文22~345.1 抽取... 阅读全文

posted @ 2018-06-26 16:41 redcoatjk 阅读(322) 评论(0) 推荐(0) 编辑

摘要: 阅读全文

posted @ 2018-06-26 11:31 redcoatjk 阅读(327) 评论(0) 推荐(0) 编辑

摘要: 2概述设计模块最主要的操作分为: 转换和作业选择转换和作业后就可以选择对应主对象树和核心对象主对象树大同小异核心对象是不同的比如转换需要用到的CSV表输入, 表输入等都在这里可以选择而作业的核心对象是:2.1 转换转换是ETL解决方案中最主要的部分, 它处理抽取、转换、加载各阶段各中对数据行的操作。转换1/N个步骤。如图, 下面是一个转换的过程图中每个框都是一个步骤(step),而连接框的线就是所... 阅读全文

posted @ 2018-06-26 11:28 redcoatjk 阅读(1672) 评论(0) 推荐(0) 编辑