摘要: INFORMATICA SERVER的调优我认为主要从两个级别来做,一个是MAPPING级别,一个是SESSION级别。 对于MAPPING级别的调优: 一 对MAPPING数据流向的优化: 1 控制源头过来的数据内容,根据设计需求,不需要过来的数据尽量不加载。当然这个主要在SOURCE QUALI 阅读全文
posted @ 2016-08-24 17:04 TwinStudio 阅读(685) 评论(0) 推荐(0) 编辑
摘要: 当一套BI 解决方案成熟运行后,公司会快速扩大客户群,这时快速的将开发出来的SOLUTION 应用到全新的生产环境中就很重要了,下面谈谈我做这样项目(INFORMATICA BACKUP&RESTORE)的一点经历。 大概步骤如下: 1连接到需要实施的生产环境INFA SERVER上,检查对应环境信 阅读全文
posted @ 2016-08-24 16:55 TwinStudio 阅读(1105) 评论(0) 推荐(0) 编辑
摘要: 5W1H法来实现源数据的优化 做数据仓库项目的朋友都能感到数据质量和数据抽取展现的性能是整个数据仓库项目的重点。下面谈谈我在DW项目中处理源数据质量问题的5W1H方法。 5W : WHO ,WHAT,WHY,WHEN,WHERE WHO:(谁来对源数据负责) ETL抽取的数据各种各样,有些是按业务, 阅读全文
posted @ 2016-08-24 16:53 TwinStudio 阅读(1029) 评论(0) 推荐(0) 编辑
摘要: 软件开发的一般都有三个环境,开发环境,用户接受度测试环境,生产环境。我最近实施了从开发环境到生产环境的部署工作,在此跟大家分享一下。 大概步骤如下: 1 备份生产环境INFORMATICA 知识库 登录CONSOLE备份当前的知识库。 2 在开发环境的INFORMATICA REPOSITORY M 阅读全文
posted @ 2016-08-24 16:52 TwinStudio 阅读(608) 评论(0) 推荐(0) 编辑
摘要: LOOKUP TRANSFORMATION的使用点评: LOOKUP基本用法不熟的话请参考下附属信息。 用法感受: 1 LOOKUP的作用跟我们以前在EXCEL的函数功能类似,就是隔表取值。优点就是用ETL工具可以设置CACHE,大量的 数据也可以实现这个功能。数据量大的话要设置CACHE ENAB 阅读全文
posted @ 2016-08-24 16:48 TwinStudio 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 数据分析系统的总体架构分为四个部分 —— 源系统、数据仓库、多维数据库、客户端(图一:pic1.bmp) 其中,数据仓库(DW)起到了数据大集中的作用。通过数据抽取,把数据从源系统源源不断地抽取出来,可能每天一次,或者每3个小时一次(当然是自动的)。这个过程,我们称之为ETL过程。 那么,今天,我们 阅读全文
posted @ 2016-08-24 14:16 TwinStudio 阅读(472) 评论(1) 推荐(0) 编辑