书犹药也,善读之可以医愚。|

Lilaaa

园龄:1年粉丝:0关注:0

Hive 元数据

元数据,即解释数据的数据。在Hive架构中,数据库/表内实际数据存放在HDFS之类的分布式存储系统中,但这些数据并不带有数据库/表/字段之类的描述信息,这些信息均由单独的关系型数据库维护(一般用MySQL)。

表信息

TBLS

记录数据表的信息,可以作为左表,去关联表的其他信息。

img

TABLE_PARAMS

存储Hive表的属性信息,表结构如下,就三个字段。

img

每个表的信息基本上都有如下属性:

img

COLUMNS_V2

保存表的字段信息

img

2

分区信息

PARTITIONS

img

PARTITION_PARAMS

分区的参数

img

参数可选值:

img

PARTITION_KEYS

分区字段的名字,类型,顺序

img

PARTITION_KEY_VALS

分区字段的值

img

3

数据库信息

DBS

记录数据库的信息

img

4

版本信息

Version

该表只能有一条记录,保存了 Hive 的版本信息。

img

5

存储相关

SDS

此对象包含有关属于表的数据的物理存储的所有信息,数据表的存储描述。

img

SD_PARAMS

该表存储Hive存储的属性信息,在创建表时候使用. 通过STORED BY

img

6

序列化相关,存储格式

SERDES

记录序列化和反序列化信息

img

SERDES_PARAM

img

7

自定义函数

FUNCS

记录用户的自定义函数

img

本文作者:Lilaaa

本文链接:https://www.cnblogs.com/lila720/p/18273948

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   Lilaaa  阅读(30)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起