- 学习花费2h
- 一、安装
- 1.安装JDK1.8及以上(推荐低版本对计算机的资源消耗少)
- 2.安装python2.6.1
- 添加环境变量
- 使用的是python3和python2在用户级别的环境变量中的添加
- 环境变量图示
- 使用的是python3和python2在用户级别的环境变量中的添加
- 复制命名
- 备注:由于python2.6.1无pip,而本人使用的过程项目对于python2没有安装需求,所以这里没有安装
- 这里对python2.6.1中,复制python.exe文件,命名为python2.exe
- 在cmd里切换调用
- 切换调用
- 提示:由于pip没有复制重命名,所以在cmd,pip时是在给python3.6.5安装插件
- 添加环境变量
- 3.安装datax
- 官网下载
- 解压至一目录
- 图示
- 二、自检
- 进入bin目录,进行自检
- 进入bin目录
- 图示
- 进行自检
- 自检脚本: python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json
- 本机命令
- python2 D:\装机软件\python编程\大数据采集技术\datax/bin/datax.py D:\装机软件\python编程\大数据采集技术\datax/job/job.json
- cmd乱码解决:输入CHCP 65001
- 自检截图
- 进入bin目录
- 进入bin目录,进行自检
- 三、查看配置模板进行配置
- 前提:要在bin目录下
- 查看配置文件
- python2 datax.py -r streamreader -w streamwriter
- 图示
- 在job文件夹下,新建json文件
- 图示1
- 按自己的需求配置json文件
- 示例
-
{ "job": { "content": [ { "reader": { "name": "streamreader", "parameter": { "sliceRecordCount": 10, "column": [ { "type": "long", "value": "10" }, { "type": "string", "value": "hello,你好,世界-DataX" } ] } }, "writer": { "name": "streamwriter", "parameter": { "encoding": "UTF-8", "print": true } } } ], "setting": { "speed": { "channel": 5 } } } }
-
- 示例
- 四、运行Job
- 命令
- python2 datax.py D:\装机软件\python编程\大数据采集技术\datax/job/stream2stream.json
- 运行截图1
- 运行截图2
- 命令
- 一、安装
- 使用4h(主要在调试)
- 小练习csv数据导入mysql
- 准备工作
- CSV表
- 图示
- 创建数据库和表
- 图示
- CSV表
- 步骤
- 第一步、创建作业的配置文件(json格式)
- 命令
- python2 datax.py -r txtfilereader -w mysqlwriter
- 命令
- 第二步、根据配置文件模板填写相关选项
- 第三步:启动DataX
- 命令
- 进入datax\bin
- cd\
- d:
- cd datax\bin
- 乱码解决
- CHCP 65001
- python2 datax.py D:\datax\job\test.json
- 进入datax\bin
- 命令
- 第一步、创建作业的配置文件(json格式)
- 遇到的问题及解决方案
- 1、一直报json文件配置不正确
- 原因是因为在编辑json文件时,某些字符编码发生了变化
- 解决方案:
- (1)从官方文档找到demo,创建json文件
- (2)采用Hbuilder X进行编辑,检查错误
- 2、数据库连接不上的问题
- 原因:datax官方支持的mysql5.0版本的驱动和连接的jdbcUrl
- 解决方案
- 更换本机的8.0驱动
- 修改jdbcUrl
- 3、插入数据库失败
- 原因:设计表时:ID设置为不为空,没有设置为自动递增
- 4、读取的数据有乱码
- 设置
- "encoding": "UTF-8"
- "encoding": "GBK"
- 设置
- 5、json配置文件错误
- 图示1和图示2是mysql写入mysql中的json文件配置,有一个地方很容易发生错误
- 就是在jdbcURL这里,reader里的有[],writer里的没有[]
- 给的启示就是,多注意细节,尽量使用命令查看模板
- python2 datax.py -r txtfilereader -w mysqlwriter
- 图示1
- 图示2
- 图示1和图示2是mysql写入mysql中的json文件配置,有一个地方很容易发生错误
- 1、一直报json文件配置不正确
- 准备工作
- 小练习csv数据导入mysql