sqoop 使用指定条件导入数据
在測试sqoop语句的时候,一定要限制记录数量。否则就像我刚才,等了1个多小时。才看到測试结果。
sqoop-import --options-file media_options.txt --table my_table --where "ID = 2" --target-dir /user/jenkins/bigdata/import/20140607 -m 1 --fields-terminated-by '\001' --lines-terminated-by '\n'
导入后。能够用hdfs dfs -get命令获取文件到本地文件夹
然后用bunzip2 命令解压。
最后用emacs的hexl-mode查看文件的16进制格式。检查切割符是否正确。