• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

最年轻首席架构师

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

随笔分类 -  大数据~Hive

Hive是hadoop的一个数据仓库工具,用来解决海量结构化日志的数据统计工具,可以将结构化数据文件映射为一张表,并提供查询功能。 Hive的本质是将HQL语句转化为MapReduce的程序来进行计算查询服务。其中hive处理后的数据存储在HDFS,也可以加载到本地。 Hive 通过给用户提供的一系列交互接口,接收到用户的指令(SQL),使用自己的 Driver, 结合元数据(MetaStore),将这些指令翻译成 MapReduce,提交到 Hadoop 中执行,最后,将 执行返回的结果输出到用户交互接口。
Hive SQL语句的正确执行顺序
摘要:今天我们通过 explain 来验证下 sql 的执行顺序。 在验证之前,先说结论,Hive 中 sql 语句的执行顺序如下: from .. where .. join .. on .. select .. group by .. select .. having .. distinct .. o 阅读全文

posted @ 2022-08-07 00:28 最年轻首席架构师 阅读(981) 评论(1) 推荐(1)

 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3