Hive 元数据
元数据,即解释数据的数据。在Hive架构中,数据库/表内实际数据存放在HDFS之类的分布式存储系统中,但这些数据并不带有数据库/表/字段之类的描述信息,这些信息均由单独的关系型数据库维护(一般用MySQL)。
表信息
TBLS
记录数据表的信息,可以作为左表,去关联表的其他信息。
TABLE_PARAMS
存储Hive表的属性信息,表结构如下,就三个字段。
每个表的信息基本上都有如下属性:
COLUMNS_V2
保存表的字段信息
2
分区信息
PARTITIONS
PARTITION_PARAMS
分区的参数
参数可选值:
PARTITION_KEYS
分区字段的名字,类型,顺序
PARTITION_KEY_VALS
分区字段的值
3
数据库信息
DBS
记录数据库的信息
4
版本信息
Version
该表只能有一条记录,保存了 Hive 的版本信息。
5
存储相关
SDS
此对象包含有关属于表的数据的物理存储的所有信息,数据表的存储描述。
SD_PARAMS
该表存储Hive存储的属性信息,在创建表时候使用. 通过STORED BY
6
序列化相关,存储格式
SERDES
记录序列化和反序列化信息
SERDES_PARAM
7
自定义函数
FUNCS
记录用户的自定义函数
本文作者:Lilaaa
本文链接:https://www.cnblogs.com/lila720/p/18273948
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步