informatica简易教程
一、环境配置
1.informatica的元数据(账号、密码…)信息保存在Oracle上面
2.Linux下在infa/bin里有informatica的启动脚本startup_infa.sh
3.修改windows主机的hosts,地址C:\Windows\System32\drivers\etc
添加192.168.68.128 infa到文件中,infa就是到时候连接配置的域名,而192.168.68.128就是informatica服务器主机的ip地址。
4.配置连接
*Gateway Host就是我们刚才修改那个C:\Windows\System32\drivers\etc里面的域名
*Gateway port必须为6001
*Domain Name可以随便取
二、模块
Informatica总的来说由4大模块组成:
Repository Manager--资料库,Designer--设计器,Workflow Manager--物理设计,Workflow Monitor--监控;
1.Repository Manager--资料库
可以管理文件夹,导入导出工作流极相关文件。
2.Designer--设计器
数据源Sources、目标加载表Targets和采集清洗过程mapping等逻辑设计存放处。可以在designer模块添加存储库。
3.Workflow Manager--物理设计
会话session和工作流workflow设计。
4.Workflow Monitor--监控
监控工作流运行情况并记下日志。
三、范例
1.导入数据采集源表逻辑结构
2.导入目标加载表逻辑结构
3.创建mapping
source组件中设置采集语句。
lookup组件可以输入参数查询数据。
expression组件可以根据informatica函数对字段进行处理,例如是否为空isnull,类型转换等。
updates组件可进行新增、更新、删除操作。*需要指定目标表逻辑主键
router路由器可以进行分组。
filter可以进行筛选过滤留下符合条件的数据。
预处理可以在过程开始前运行sql语句。
后处理可以在过程完成后运行sql语句。
mapping参数需要以$$开头
4.创建session
session的参数以$开头,有特定的格式。如$ParamName,Name可以自己定义
需要在session中-编辑-配置对象下stop on errors中设置值为1,若为0则session出错不会停止运行
在session中-映射-连接中可以配置连接数据库的参数。
5.创建工作流
在工作流-编辑-属性下设置参数文件目录
将目标session拖入工作流中使用连接组件将启动和session连接。
编辑工作流中的session组件将如果任务失败,父项也失败 为✔
6.测试工作流
运行工作流
在Workflow Monitor下查看运行状况
可以查看运行日志
7.导出工作流文件
在Repository Manager下选中目标工作流(可多选)
右键导出就可以导出工作流包括依赖的session、mapping、source、target