SparkSQL 访问 hive
1.1 从 hive读数据
object HiveRead { def main(args: Array[String]): Unit = { val spark = SparkSession.builder() .master("local[*]") .appName("HiveRead") .enableHiveSupport() .getOrCreate() import spark.implicits._ spark.sql("show databases") spark.sql("use gmall") spark.sql("select count(*) from ads_uv_count").show() spark.close() } }
1.2 从 hive写数据
object HiveWrite2 { def main(args: Array[String]): Unit = { System.setProperty("HADOOP_USER_NAME","xingmeng") val spark = SparkSession.builder() .master("local[*]") .appName("HiveRead") .enableHiveSupport() .config("spark.sql.warehouse.dir","hdfs://hadoop102:9000/user/hive/warehouse") .getOrCreate() //先创建一个数据库 // spark.sql("create database spark1016") // spark.sql("use spark1016") // spark.sql("create table user1(id int, name string)").show() // spark.sql("insert into table user1 VALUES(10,'lisi')") val df = spark.read.json("F:/BaiduNetdiskDownload/15-spark/spark-coreData/users.json") spark.sql("use spark1016") val df1 = spark.sql("select * from a") val df2 = spark.sql("select sum(age) sum_age from a group by name") df1.write.saveAsTable("a1") //hive 聚合后,分区数会成为200 df2.coalesce(1).write.mode("overwrite").saveAsTable("a2") spark.close() } }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人