第五章_DML_数据操作_数据导出 【导出txt、csv】

-- 1. 将查询结果导出到 本地
insert overwrite local directory '/root/sanguo4'
row format delimited fields terminated by ',' -- 不指定时 使用默认分隔符
stored as textfile -- 不指定时, 默认使用textfile
select * from home.arraytab;

-- 注意事项
-- 将查询结果导出到 指定目录,数据文件为 000000_0

-- 2. 将查询结果导出到 hdfs
insert overwrite directory '/root/sanguo4'
row format delimited fields terminated by '#' -- 不指定时 使用默认分隔符
stored as textfile -- 不指定时, 默认使用textfile
select * from home.arraytab;


-- 3. hive shell 导出数据(导出txt)
hive -e "select * from home.arraytab" > sanguo4.txt

-- 注意事项
-- 带表头导出,字段分隔符无法设置

-- 4. beeline shell 导出数据(csv)
beeline -u jdbc:hive2://gaocun:10000 -n root \
--showHeader=false \
--outputformat=csv2 \
-e "select * from home.arraytab" > sanguo4.txt;

-- 注意事项
-- showHeader=false 是否导出表头
-- outputformat=csv2 导出格式
-- table/vertical/csv/tsv/dsv/csv2/tsv2

-- 打开csv后,乱码
-- 乱码原因 : 乱码的原因是用excel打开csv时格式默认为gbk,但是从hive中导出来的是utf8的
iconv -f UTF-8 -c -t GBK sanguo4.csv > sanguo41.csv

-- 5. 导出到 hdfs
-- 用户hadoop 平台间数据迁移
export table home.maptab to '/maptab';

-- 导入
import table home.maptab1 from '/maptab';







posted @   学而不思则罔!  阅读(216)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界
点击右上角即可分享
微信分享提示