Sqoop(一)
1.定义
我们先来看看官方对于Sqoop的定义
Apache Sqoop是一个工具专门用来处理Apache Hadoop和其他结构化数据的数据传输问题的,比如:关系型数据库。
Sqoop的原理是将用户提供的导入导出的命令或者脚本翻译成Mapreduce来实现的。
2.安装
从官网下载最新版本的sqoop:http://sqoop.apache.org/,将下载下来的sqoop包上传到服务器,利用tar命令解压
tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /xxx
解压完成后进入sqoop的conf目录,进行相应的配置:
先将sqoop-env-template.sh的名字改成sqoop-env.sh
mv sqoop-env-template.sh sqoop-env.sh
然后用vi命令对它进行一些修改,这些修改主要是给sqoop提供一些必要的环境变量。
export HADOOP_COMMON_HOME=xxx
export HADOOP_MAPRED_HOME=xxx
服务器节点上一定要有可用hive
export HIVE_HOME=xxx
export ZOOKEEPER_HOME=xxx
export ZOOCFGDIR=xxxx
我们可以直接将上面这段配置直接复制到sqoop-env.sh的尾部,做响应修改就可以了。
这样我们的sqoop的环境就算配好了,可以直接使用了!