摘要: 一、Explain 1.1.功能 HiveQL是一种类SQL的语言,从编程语言规范来说是一种声明式语言,用户会根据查询需求提交声明式的HQL查询,而Hive会根据底层计算引擎将其转化成Mapreduce/Tez/Spark的 job。大多数情况下,用户不需要了解Hive内部是如何工作的,不过,当用户 阅读全文
posted @ 2024-09-29 17:56 酒剑仙* 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 一、Hive文件格式 Hive数据存储的本质还是HDFS,所有的数据读写都基于HDFS的文件来实现,为了提高对HDFS文件读写的性能,Hive中提供了多种文件存储格式:TextFile、SequenceFile、RCFile、ORC、Parquet等。不同的文件存储格式具有不同的存储特点,有的可以降 阅读全文
posted @ 2024-09-29 17:55 酒剑仙* 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 一、Hive架构设计 1.1.Hive架构设计 由上图可知,Hive全局架构图中可以看到Hive架构包括如下组件:CLI(command line interface)、JDBC/ODBC、MetaStore和Driver(Compiler、Optimizer)。 CLI:command line 阅读全文
posted @ 2024-09-29 17:51 酒剑仙* 阅读(15) 评论(0) 推荐(0) 编辑