hive笔记

set hive.cli.print.header=true;
-- 显示字段名称
set hive.cli.print.current.db=true;
-- 显示当前数据库名
drop database dbname CASCADE;
-- 删除数据库及库中表
alter database dbname set dbproperties(key=value);
-- 设置数据库元数据
alter table table_name set tblproperties('creator'='wangbin');
alter table table_name set tblproperties('EXTERNAL'='FALSE');    
-- 注意大写的单词外部表转内部表
alter table table_name set serdeproperties('field.delim'='\t');
-- 修改序列化信息
alter table table_name partition(dt='') set fileformat sequencefile;
-- 修改表的存储属性
alter table table_name partition(dt='') set location 'hdfs://...';
-- 修改表存储位置
insert overwrite directory 'hdfs://...' select  *  from table_name;
-- 将查询数据导入到一个hdfs目录
order by 
--全局排序
sort by 
--局部（每个reducer）排序
distribute by + 字段 
--控制相同字段的map输出会发到一个reduce
cluster by 
--等价于distribute by +sort by 
left semi join 
-- 左半连接，只返回左表中符合on条件的数据
posted @ 2019-02-12 17:32 Mars.wang 阅读(218) 评论(0) 收藏举报
刷新页面返回顶部