ETL数据抽取策略
优点:ETL系统设计清晰,源数据抽取相对清楚简单,速度快。可以实现数据的递增加载。
在OLTP系统中添加系统日志表,当业务数据发生变化时,更新维护日志表内容,当作ETL加载时,通过读日志表数据决定加载那些数据及如何加载。
优点:不需要修改OLTP表结构,源数据抽取清楚,速度较快。可以实现数据的递增加载。
缺点:日志表维护需要由OLTP系统完成,需要对OLTP系统业务操作程序作修改,记录日志信息。日志表维护较为麻烦,对原有系统有较大影响。工作量较大,改动较大,有一定风险。
优点:对已有系统表结构不产生影响,不需要修改业务操作程序,所有抽取规则由ETL完成,管理维护统一,可以实现数据的递增加载,没有风险。
缺点:对于维表加代理键不适应,当OLTP系统产生删除数据操作时,OLAP层将不会记录到所删除的历史数据。不可以实现数据的递增加载。
通过在源系统的数据库中设置触发器,每当有Update、Insert、Delete操作时触发一个事件将发生改变的记录抽取到相应的临时表中。
优点:ETL加载规则简单,速度快,不需要修改OLTP表结构,可以实现数据的递增加载。