大数据技术Talend输出Mysql数据到HDFS

1. 配置talend和大数据集群的连接

1) 修改Windows本地hosts文件,添加以下内容

192.168.1.100 hadoop100

192.168.1.101 hadoop101

192.168.1.102 hadoop102

192.168.1.103 hadoop103

192.168.1.104 hadoop104

2) 找到“元数据”下面HadoopCluster右键单击,选择 “create Hadoop cluster”

大数据技术Talend输出Mysql数据到HDFS

 

3) 本案例基于apache原生hadoop2.7.2版本大数据环境测试,这里选择Amazon EMR, 版本选择EMR5.0.0(Apache2.7.2),剩下的按照自己的大数据培训集群配置其他信息。

大数据技术Talend输出Mysql数据到HDFS

 

4) 填写完配置信息以后,点击下面的检查服务,检查服务过程中会下载额外的第三方依赖插件,点击全部接受下载,直至Namenode进度条为100%全绿,说明hadoop集群配置正确

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

5) Hadoop集群连接成功之后,可以看到Hadoop Cluster下会生成一个myhadoop0.1的组件,然后右键点击myhadoop0.1选择create HDFS

大数据技术Talend输出Mysql数据到HDFS

 

6) 在弹出的HDFS Connection中填写名称,目的,描述,然后点击下一步,填写对应的配置信息,直至点击check按钮,出现成功连接的提示信息

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

7) HDFS连接创建好后,右键点击myhadoop0.1选择create Hive,在弹出的hive数据库连接框里依次填写hive的配置信息,如图所示

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

8) 填写完配置信息以后,点击测试连接按钮,直至显示hive连接成功的提示,说明hive链接创建成功,注意在测试连接前,一定要先在服务器上开启hiveserver2的服务,否则会报错。

大数据技术Talend输出Mysql数据到HDFS

 

2. MySQL中表的数据上传到hdfs

1) 在demo文件夹下新建作业mysql_hdfs2

大数据技术Talend输出Mysql数据到HDFS

 

2) 配置mysql连接,我们既可以在使用组件时进行配置,也可以先提前在元数据中配置好各种数据库连接,然后直接拖到工作区使用。配置步骤如下

在元数据中新建mysql 连接

大数据技术Talend输出Mysql数据到HDFS

 

填写mysql连接信息

大数据技术Talend输出Mysql数据到HDFS

 

如下图,已经连接成功。

大数据技术Talend输出Mysql数据到HDFS

 

3) 开始拖拽组件,把mysql连接拖放到设计工作区,选择组件 “tDBInput(MySQL)”

大数据技术Talend输出Mysql数据到HDFS

 

4) 点击工作区mysql的图标,选择 “组件”,表填写MySQL中刚才写入表valid_movie,查询语句补充完整,“select * from valid_movie”,点击“Guess schema”

大数据技术Talend输出Mysql数据到HDFS

 

之后会出现这张表的字段和类型。你可以修改字段名/选择保留的字段等。

大数据技术Talend输出Mysql数据到HDFS

 

5) 在右侧搜索tLogRow,这个组件相当于输出,可以显示我们的数据

大数据技术Talend输出Mysql数据到HDFS

 

6) 左侧找到刚刚添加的hdfs连接,拖放到设计工作区,在弹出的组件选择框中选择HDFSOutPut组件,然后设置hdfs 存储文件的位置,文件名称,文件类型(序列化或者文本文件),动作(重写/追加)

大数据技术Talend输出Mysql数据到HDFS

 

大数据技术Talend输出Mysql数据到HDFS

 

7) 把三个组件进行连接

大数据技术Talend输出Mysql数据到HDFS

 

8) 运行作业,valid_movie表内容打印在控制台上

大数据技术Talend输出Mysql数据到HDFS

 

HDFS也有了表中的数据,表示mysql-hdfs 数据转移成功。

大数据技术Talend输出Mysql数据到HDFS
posted @ 2022-04-19 14:34  Linux运维阿铭  阅读(89)  评论(0编辑  收藏  举报