代码改变世界

PDI的steps:(4:Add sequence)

2013-05-23 21:34 by 很大很老实, 446 阅读, 0 推荐, 收藏, 编辑
摘要:种类:转换;id:Sequence;描述:从sequence中获取下一个值。所属类:addsequence.AddSequenceMeta用来在stream中增加一个sequence,这个sequence,可以来自数据库,也可以是kettle自己生成的。Examples:Start at = 1, increment by = 1, max value = 3This will produce: 1, 2, 3, 1, 2, 3, 1, 2...Start at = 0, increment by = -1, max value = -2This will produce: 0, -1, -2 阅读全文

PDI的steps:(3:Add constants )

2013-05-20 19:33 by 很大很老实, 186 阅读, 0 推荐, 收藏, 编辑
摘要:名称:Add constants类型:转换;id:Constant描述:在输入行中增加1个或者多个常量。所属类:org.pentaho.di.trans.steps.constant.ConstantMetaOptionsOptionDescriptionStep nameName of the step.Note: This name has to be unique in a single transformation. Fields specify the name, type, and value in the form of a string. Then, specify the f 阅读全文

PDI的steps:(2:Add a checksum)

2013-05-20 19:13 by 很大很老实, 329 阅读, 0 推荐, 收藏, 编辑
摘要:steps的连接:http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+Steps名称:Add a checksumid:CheckSum种类:转换;描述:对input的每一行,加一个checksum列。所属类:org.pentaho.di.trans.steps.checksum.CheckSumMetaOptionDescriptionStep nameName of the step. Note: This name has to be unique in a single transformation.TypeThe 阅读全文

vmware vsphere 5虚拟数据中心构建指南(一)

2013-05-19 18:10 by 很大很老实, 683 阅读, 0 推荐, 收藏, 编辑
摘要:本书主要是以大众化的形式,介绍以下内容:第一章,专门为帮助读者理解vmware vsphere5 而写.后续章节解释这一技术和数据中心各要素(服务器,存储,网络)之间的关系,以及备份和服务持续性的各种方案.其中包括vsphere5的安装和操作管理.第八章介绍一个大型公司的案例.第一章:从服务器虚拟化到云计算本章目录如下:虚拟化:IT变革的核心 服务器虚拟化; 采用服务器虚拟化的要素; 虚拟化环境规范; 1)更改数据中心模型; 从一堆小型物理服务器模式,变为一台高性能独立服务器模式;这时候,存储成为支柱,必须提供高性能和安全性。同时,网络带宽也需要保证。 2)虚拟机 ... 阅读全文

PDI的step:(1:abort)

2013-05-18 11:19 by 很大很老实, 334 阅读, 0 推荐, 收藏, 编辑
摘要:本系列介绍PDI的step。这里介绍第一个:Abort。name:Abort;类型:Flow。id:Abort。描述:终止一个转换。所属类:org.pentaho.di.trans.steps.abortMeta.这个step,允许你在发现有输入的时候,终止转换。这主要用在错误处理等场景。配置信息:OptionDescriptionStep nameName of the step.Note: This name has to be unique in a single transformation.Abort thresholdThe threshold of number of rows 阅读全文

kettle---用户手册(7:变量)

2013-05-18 11:07 by 很大很老实, 2398 阅读, 0 推荐, 收藏, 编辑
摘要:我觉得这一章是比较重要的,在kettle中定义变量。变量可以用在PDI的任何地方,包括转换和job。通过set Variable在转换或者job中设置变量,也可以设置在kettle.properties文件中,不过,kettle.properties文件要放在以下位置:$HOME/.kettle (Unix/Linux/OSX)C:\Documents and Settings\<username>\.kettle\ (Windows)C:\Users\<username>\.kettle\ (Windows Vista)我们可以通过使用“Get Variable”st 阅读全文

kettle---用户手册(3:创建hops)

2013-05-18 10:27 by 很大很老实, 810 阅读, 0 推荐, 收藏, 编辑
摘要:hop是用来吧transformation和job连接起来的。数据流动的方向在hop里是通过箭头表示的。hop可以设置为有效或者无效。下面介绍主要是以下内容:Transformation HopsJob HopsCreating a HopSplitting a HopLoopsMixing Rows-Trap DetectorTransformation Hop ColorsTransformation Hops:如果在转换中,hop是无效的,那么,在数据流方向上,其后的单元将得不到任何数据。从而导致结果是无效的。比如,在无效hop的下一个转换,单击get fields,讲啥都得不到。job 阅读全文

kettle---用户手册(3:创建一个数据库链接)

2013-05-17 20:48 by 很大很老实, 481 阅读, 0 推荐, 收藏, 编辑
摘要:本章包括以下内容:Creating a New Database ConnectionEditing a ConnectionDuplicating a ConnectionCopying to a ClipboardDeleting a ConnectionExecuting SQL Commands on a ConnectionClearing the Database Cache OptionQuotingDatabase Usage GridConfiguring JNDI ConnectionsUnsupported Databases第一步:创建一个数据库连接,图形操作界面如下: 阅读全文

kettle---用户手册(2:创建一个转换或者job)

2013-05-17 18:16 by 很大很老实, 422 阅读, 0 推荐, 收藏, 编辑
摘要:这个类容之前的博客里也有,就不綴述。 阅读全文

kettle---用户手册(1:介绍spoon)

2013-05-17 17:52 by 很大很老实, 580 阅读, 0 推荐, 收藏, 编辑
摘要:继续我们这一块的工作。pan:pan是一个数据引擎,从不同的数据源读取,转换和写入数据。kitchen:是一个程序,用来执行job。Transformations and Jobs可以听过xml文件或者数据库里的信息来描述自身的行为。下表列出转换中的一些定义:TransformationDescriptionValueValues are part of a row and can contain any type of data: strings, floating point numbers, unlimited precision BigNumbers, integers, dates 阅读全文