hive meta sql

Hive Meta SQL介绍:
Hive是一个在HADOOP平台进行大规模分布式数据分析的工具,有点类似数据仓库工具。
Hive Meta信息一般存储在关系型数据库中,用于存储hive表的结构,字段,partition等信息。
 
1,查询hive table创建时间,所属人等信息
        select TBL_ID,CREATE_TIME,TBL_NAME,OWNER from TBLS;

 

2,查询hive table字段类型信息
        select COLUMN_NAME,TYPE_NAME,COMMENT from COLUMNS a left join TBLS b ON a.SD_ID=b.SD_ID;

 

3,查询hive在HDFS上默认存储的路径
        select DB_LOCATION_URI from DBS where NAME='default';

 

4,根据hive表名查询hive表的输入/输出对象类型,数据存储hdfs路径,序列化对象类型。
    select INPUT_FORMAT,OUTPUT_FORMAT,IS_COMPRESSED,
    LOCATION,SLIB from SDS a left join TBLS b ON a.SD_ID=b.SD_ID 
    left join SERDES c on c.SERDE_ID=a.SERDE_ID where b.TBL_NAME='movie';
 
5,根据hive表名查询hive表的partitioner名称和partitioner的分区值。
    select c.PKEY_NAME,b.PART_NAME,a.PART_KEY_VAL from PARTITION_KEY_VALS a 
    left join PARTITIONS b on a.PART_ID=b.PART_ID LEFT JOIN PARTITION_KEYS c 
    on c.TBL_ID=c.TBL_ID left join TBLS d on d.TBL_ID=c.TBL_ID;





posted on 2012-03-24 08:24  reck for zhou  阅读(694)  评论(0编辑  收藏  举报

导航