本周总结

大三开学的第一周,我们开始上课了,每天开始了上课,在闲暇之余也去练了Hadoop连接数据库的练习。

1

mysql数据导入到hdfs数据

hadoop提供了org.apache.hadoop.io.Writable接口来实现简单的高效的可序列化的协议,该类基于DataInput和DataOutput来实现相关的功能。

hadoop对数据库访问也提供了org.apache.hadoop.mapred.lib.db.DBWritable接口,其中write方法用于对PreparedStatement对象设定值,readFields方法用于对从数据库读取出来的对象进行列的值绑定;

见  https://blog.csdn.net/lianggangzzu/article/details/72594186

见  https://blog.csdn.net/fantasticqiang/article/details/80667023

2

hdfs数据导入到mysql

hdfs文件存储到mysql,也需要上边的DBRecord类作为辅助,因为数据库的操作都是通过DBInput和DBOutput来进行的;

posted @ 2022-09-03 12:05  好(justice)……  阅读(8)  评论(0编辑  收藏  举报