摘要: 这两天一直在思考一个问题,为什么要用专业的etl工具进行数据清洗,原因如下: ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。 如果数据转换的频率或者要求不高可以手动实现ETL的 阅读全文
posted @ 2017-01-09 10:10 田园沃土 阅读(442) 评论(0) 推荐(0) 编辑