Spark学习之路（二十）SparkSQL的元数据

讨论QQ：1586558083

正文

回到顶部

一、概述

SparkSQL 的元数据的状态有两种：

1、in_memory,用完了元数据也就丢了

2、hive , 通过hive去保存的，也就是说，hive的元数据存在哪儿，它的元数据也就存在哪儿。

　换句话说，SparkSQL的数据仓库在建立在Hive之上实现的。我们要用SparkSQL去构建数据仓库的时候，必须依赖于Hive。

回到顶部

二、Spark-SQL脚本

如果用户直接运行bin/spark-sql命令。会导致我们的元数据有两种状态：

1、in-memory状态:

如果SPARK-HOME/conf目录下没有放置hive-site.xml文件，元数据的状态就是in-memory

2、hive状态：

如果我们在SPARK-HOME/conf目录下放置了，hive-site.xml文件，那么默认情况下

spark-sql的元数据的状态就是hive.

posted @ 2019-06-11 11:58 技术研究与问题解决阅读(455) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 地球OL攻略 —— 某应届生求职总结
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】

公告

昵称：技术研究与问题解决
园龄： 6年2个月
粉丝： 36
关注： 18

+加关注

2025年3月

日

一

二

三

四

五

六

Spark学习之路（二十）SparkSQL的元数据

一、概述

二、Spark-SQL脚本

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

Spark学习之路 （二十）SparkSQL的元数据

一、概述

二、Spark-SQL脚本

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

Spark学习之路（二十）SparkSQL的元数据