SparkSQL 访问 hive

1.1   从 hive读数据

复制代码
object HiveRead {

  def main(args: Array[String]): Unit = {


    val spark = SparkSession.builder()
      .master("local[*]")
      .appName("HiveRead")
      .enableHiveSupport()
      .getOrCreate()

    import spark.implicits._


    spark.sql("show databases")
    spark.sql("use gmall")
    spark.sql("select count(*) from ads_uv_count").show()


    spark.close()

  }

}
复制代码

1.2   从 hive写数据

复制代码
object HiveWrite2 {

  def main(args: Array[String]): Unit = {

    System.setProperty("HADOOP_USER_NAME","xingmeng")

      val spark = SparkSession.builder()
        .master("local[*]")
        .appName("HiveRead")
        .enableHiveSupport()
        .config("spark.sql.warehouse.dir","hdfs://hadoop102:9000/user/hive/warehouse")
        .getOrCreate()

      //先创建一个数据库

//    spark.sql("create database spark1016")
//    spark.sql("use spark1016")
//    spark.sql("create table user1(id int, name string)").show()
//    spark.sql("insert into table user1 VALUES(10,'lisi')")

    val df = spark.read.json("F:/BaiduNetdiskDownload/15-spark/spark-coreData/users.json")
    spark.sql("use spark1016")


    val df1 = spark.sql("select * from a")
    val df2 = spark.sql("select sum(age) sum_age from a group by name")

    df1.write.saveAsTable("a1")
    //hive 聚合后,分区数会成为200
    df2.coalesce(1).write.mode("overwrite").saveAsTable("a2")


    spark.close()


  }

}
复制代码

 

posted @   xingmeng1  阅读(160)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示