datax安装使用
win10 安装DataX
1.资源准备
2.环境变量配置(以自己安装目录为准)
3.在cmd窗口中输入CHCP 65001 防止中文乱码
4.测试(从stream读取数据并打印到控制台)
1.资源准备
JDK1.8
Python2.7
DataX(点击下载)
2.环境变量配置(以自己安装目录为准)
%DATAX_HOME%\bin
D:\Program Files\Python27\
D:\Program Files\Java\jdk1.8.0_131\bin
3.在cmd窗口中输入CHCP 65001 防止中文乱码
书写配置文件
文件名:stream2stream.json
内容如下:
{
"job": {
"content": [
{
"reader": {
"name": "streamreader",
"parameter": {
"sliceRecordCount": 10,
"column": [
{
"type": "String",
"value": "helle DataX"
},
{
"type": "string",
"value": "你吃完晚饭了吗?"
},
{
"type": "string",
"value": "不要在写代码了,太累了"
}
]
}
},
"writer": {
"name": "streamwriter",
"parameter": {
"encoding": "GBK",
"print": true
}
}
}
],
"setting": {
"speed": {
"channel": 5
}
}
}
}
c.执行配置文件
python datax.py ..json