Powercenter体系结构和主要组件介绍
服务端组件
- Informatica Service:PowerCenter服务引擎
- Integration Service:数据抽取、转换、装载服务引擎
- Repository Service:知识库Service,管理ETL过程中产生的元数据
- Repository 的数据存储在第三方数据库(如oracle)中
客户端组件
- Administratortion Console:用于服务端各组件(Integration service、repository service)的建立与维护
- Repository Manager:知识库管理,包括安全性管理等
- Desinger:设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射
- Workflow Manager:合理地实现复杂的ETL工作流,基于时间、事件的作业调度
- Workflow Monitor:监控Workflow和Session运行情况,生成日志和报告
当服务器安装配置完成后,开发一个ETL程序的大概流程为:
1. 在repository Manager中建立和server repository的连接,并创建folder,设置正确的权限。
2. 使用Powercenter Designer在Source Analyzer视图创建源定义
3. 使用Powercenter Designer在Target designer视图创建目标定义
4. (可选,如果转换规则可复用)在Transformation developer视图创建转换规则
5. 使用Powercenter Designer在Mapping designer视图创建源和目标数据的映射关系,反应数据转换的流程。
6. (可选,如果task在workflow中可复用)根据mapping,在Powercenter workflow manager的task developer视图中创建task.
7. 根据mapping,在Powercenter workflow manager的workflow developer视图中创建workflow
7.1 建立connection定义
7.2 修改workflow中的task,设置源和目标数据
8. 执行workflow,在Powercenter workflow monitor中监控workflow的运行状况