pentaho data-integration(kettle) 资源库备份
网上抄来的,验证过,好用,哈哈
https://blog.csdn.net/zhoujianfeng3/article/details/53667327?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control
pentaho data-integration (又称kettle ,后面简称PDI )关于资源库备份这块有很多方法,将我有用到的几种方法分享给大家。
1. 如果资源库是保存在传统数据库中,如mysql、oracle等,可直接备份资源库相关的几张表。(把整个数据库或者scheme的对应数据库备份成文件)
2. 不定时手动导出资源库,把数据库类型的资源库导出来成文本类型资源库。(常见情况就是把公司资源库作业导出道本机)
3. 使用PDI 作业中自带的组件进行自动导出。
前面两种就不介绍了,重点讲下第三种方式。
打开 PDI 工具界面,创建 一个 JOB ,然后在 JOB 的组件中选中 ‘导出资源库倒xml文件’,如下
这个组件中,导出支持多种形式,你可以导出整个资源库文件,也可以导出某一个文件夹的文件,亦或者某个单独文件。我这测试导出某个文件夹的文件。如下
然后运行这个job ,就可以生成一个资源库文件了。文件内容如下
<?xml version="1.0" encoding="UTF-8"?>
<repository>
<transformations>
<transformation>
<info>
<name>ktr_field_test_dealing</name>
<description/>
<extended_description/>
<trans_version/>
<trans_type>Normal</trans_type>
<trans_status>0</trans_status>
<directory>/</directory>
<parameters>
</parameters>
这个一个xml格式的内容。然后使用PDI 中的资源库导入功能导入即可。
导入功能: 工具-》资源库-》导入资源库 (后面具体的操作我就不细述了)
导入之前,我的资源库文件目录如下:
导入之后我的资源库文件目录如下