随笔分类 -  SSIS and Kettle

摘要:Mysql 8.1 驱动放到kettle的lib目录。 在kettle安装目录,simple-jndi目录下,编辑 jdbc.properties 文件加入mysql的配置项: MYSQL8_DB/type=javax.sql.DataSource MYSQL8_DB/driver=com.mysq 阅读全文
posted @ 2019-04-30 16:13 爱知菜 阅读(34) 评论(0) 推荐(0) 编辑
摘要:在Spoon的文件栏, Edit->Edit Kettle Properties files 将 KETTLE_DEFAULT_BIGNUMBER_FORMAT 项配置为0.##### 否则的话, 默认Kettle对它认为是BigNumber的列 ,把0 会强行写成0.0, 造成不必要的冗余 阅读全文
posted @ 2018-11-05 19:13 爱知菜 阅读(148) 评论(0) 推荐(0) 编辑
摘要:在部分文件处理的kettle组件中, 你能找到一个勾选框, 名字叫 "Add filenames to result". 这是什么意思呢? Kettle有一个文件名系统, 专门储存了最近生成的或者处理过的文件名列表, 以供进一步处理, 比如移动, copy或者删除 在Job的design中你能找到几 阅读全文
posted @ 2018-09-30 11:16 爱知菜 阅读(39) 评论(0) 推荐(0) 编辑
摘要:关键点: 清理Kettle缓存: rm -rf /home/user/data-integration/./system/karaf/caches rm -rf /home/user/data-integration/./system/karaf/data karaf 是Kettle用于实现插件的一 阅读全文
posted @ 2018-09-28 17:39 爱知菜 阅读(133) 评论(1) 推荐(0) 编辑
摘要:SSIS 有 script component 允许用户用C# 或者 VB来定义复杂逻辑 Pentaho Kettle 有 Javascript 允许用户用js来定义复杂逻辑 Javascript 最后必须返回一个布尔变量(如下面示例代码中的 true;), 表示成功或者失败 可用使用 parent 阅读全文
posted @ 2018-09-18 16:35 爱知菜 阅读(43) 评论(0) 推荐(0) 编辑
摘要:首先要下载Oracle的 JDBC 驱动放到 Kettle的lib目录下 然后在Transform里具体连接Oracle的时候, 注意数据库名称填的是SID. 怎么获Oracle取数据库的SID? 可以运行下面的语句, 第一句获取数据库版本, 第二句就是SID --Get Version Info 阅读全文
posted @ 2018-09-17 16:51 爱知菜 阅读(65) 评论(0) 推荐(0) 编辑
摘要:cd "C:\Program Files (x86)\Kettle" call kitchen.bat -file:"C:\Elekta Projects\CE_Activities\MAIN.kjb" -level:Minimal 亲测上面这句可行 如果不用call的话, 会报一个错: ERROR 阅读全文
posted @ 2018-03-15 11:22 爱知菜 阅读(71) 评论(0) 推荐(0) 编辑
摘要:根据Kettle的设计所有的step在transformation里是并行运行的, 所以在transformation里无法做到针对某一个step记日志, 因为记日志那步会在transformation一开始就执行 而不会等待你要关注的那个step完成才开始. 可以把记日志的功能放到job里去: 对 阅读全文
posted @ 2018-01-11 14:41 爱知菜 阅读(92) 评论(0) 推荐(0) 编辑
摘要:先去微软下载JDBC驱动: https://www.microsoft.com/en-US/download/details.aspx?id=11774 解压后得到的目录里有 jre7 jre8 和 auth 其中auth里的sqljdbc_auth.dll是用于sqlserver的integrat 阅读全文
posted @ 2018-01-04 10:57 爱知菜 阅读(106) 评论(0) 推荐(0) 编辑
摘要:获取安全Token后, 在kettle里设置的密码是 password+Token 比如密码是123, token是789, 那就输入123789 Salesforce里的Entity与普通数据库的表不一样, 不是每一列都可以filter, 一般只有日期或数字等类型的字段支持filter, 具体可以 阅读全文
posted @ 2018-01-02 18:07 爱知菜 阅读(60) 评论(0) 推荐(0) 编辑
摘要:Auditable/Traceable Repeatable/Ease of use Adaptable The relationship between hubs is always many to many. Hub&Link&Satelite. 阅读全文
posted @ 2017-09-25 14:34 爱知菜 阅读(10) 评论(0) 推荐(0) 编辑
摘要:Data Grid: The Data Grid step allows you to enter a static list of rows in a grid. This is usually done for testing, reference or demo purposes. Calcu 阅读全文
posted @ 2017-09-01 14:22 爱知菜 阅读(157) 评论(0) 推荐(0) 编辑
摘要:关于SSIS的优化, 可以参考下面这两篇文章: http://www.cnblogs.com/ljhdo/p/5477357.html http://www.cnblogs.com/biwork/p/3330115.html 在Data Flow控件中有很多组件, 有些组件是完全阻塞型的,比如Sor 阅读全文
posted @ 2017-04-22 21:57 爱知菜 阅读(65) 评论(0) 推荐(0) 编辑
摘要:Pentaho Kettle 是开源免费的 ETL 工具 SSIS 是微软BI三件套之一 两者有很多相似的特点, 比如都是基于图形界面的控件加剪头的方式直观地来进行开发。在SSIS中具体负责数据流传输的控件叫“Data Flow”,而在Kettle里叫“Transformation”。“Data F 阅读全文
posted @ 2017-03-30 17:50 爱知菜 阅读(147) 评论(0) 推荐(0) 编辑
摘要:https://support.microsoft.com/en-us/kb/2861775 0x80040E21 or 0x80004005 error when a data flow task in an SSIS package runs an MDX query by using MSOL 阅读全文
posted @ 2016-07-07 11:58 爱知菜 阅读(48) 评论(0) 推荐(0) 编辑
摘要:http://stackoverflow.com/questions/697538/ignore-errors-on-execute-package-task-in-ssis "A better way to do this is to go to the OnError handler of yo 阅读全文
posted @ 2016-06-15 13:53 爱知菜 阅读(14) 评论(0) 推荐(0) 编辑
摘要:1. 连接字符串要加"Format=Tabular;" 例如: DTS:ConnectionString="Data Source=VrpExternalTab.partners.extranet.Microsoft.com;Initial Catalog=DevicesDataModel;Form 阅读全文
posted @ 2016-06-14 17:52 爱知菜 阅读(28) 评论(0) 推荐(0) 编辑
摘要:关系型数据库的三大范式: 第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。 第二范式(2NF)是数据库规范化中所使用的一种正规形式。它的规则是在1NF的基础上要求数据表里的所有数据都要和该数据表的主键有完全依赖 阅读全文
posted @ 2016-04-21 12:10 爱知菜 阅读(22) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示