公告

随笔分类 - 大数据~Hive

Hive是hadoop的一个数据仓库工具，用来解决海量结构化日志的数据统计工具，可以将结构化数据文件映射为一张表，并提供查询功能。 Hive的本质是将HQL语句转化为MapReduce的程序来进行计算查询服务。其中hive处理后的数据存储在HDFS，也可以加载到本地。 Hive 通过给用户提供的一系列交互接口，接收到用户的指令(SQL)，使用自己的 Driver，结合元数据(MetaStore)，将这些指令翻译成 MapReduce，提交到 Hadoop 中执行，最后，将执行返回的结果输出到用户交互接口。

Hive SQL语句的正确执行顺序

摘要：今天我们通过 explain 来验证下 sql 的执行顺序。在验证之前，先说结论，Hive 中 sql 语句的执行顺序如下： from .. where .. join .. on .. select .. group by .. select .. having .. distinct .. o 阅读全文

posted @ 2022-08-07 00:28 最年轻首席架构师阅读(982) 评论(1) 推荐(1)