spark离线分析--本地Spark1.6版本读写hive表

1. 搭建好hive环境，并将hive-site.xml文件放到本地工程的resources目录下

2. java测试代码

public class SparkHiveTest{

     public static void main(String[] args){
  
 JavaSparkContext javaSparkContext  = null;
try {
      SparkContext sparkConf =new 
      SparkConf().setAppName("SparkHiveTest").setMaster("local[*]");

    javaSparkContext   = new JavaSparkContext(sparkConf );
     HiveContext hiveContext = new HiveContext(javaSparkContext )
     //查询attack_count表数据,表结构 content ,ctime, content是json字符串，ctime是分区格式，yyyyMMdd
     string sql ="select * from test.attack_count order by ctime desc"
     DataFrame result = hiveContext .sql(sql);

     List<Row> collectAsList = result.coalesec(10).collectAsList();

     result.registerTempTable("AttackCount");
     String curDate = DateUtil.toString(new Date(), "yyyyMMdd");
     hiveContext.sql("insert into table test.attack_count partition(ctime='"+curDate+"') select content from AttackCount limit 1");
      
       }catch(Exception e){
     }finally{
     if(javaSparkContext!=null) {
      javaSparkContext.stop();
     }
  }
}

posted @ 2023-11-28 21:06 技术虫阅读(25) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· java代码常见问题及优化建议

· java的stream用法和函数式编程

· SparkSQL 访问 hive

· SparkSQL 操作Hive In Java

· SparkSQL 操作Hive

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称：技术虫
园龄： 6年9个月
粉丝： 0
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

技术虫

spark离线分析--本地Spark1.6版本读写hive表

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜