Spark读取http数据写入hive

http请求hutool,json转换

数据写入到rdd,之后转换为sparksql

SparkSession spark = SparkSession.builder().master("yarn").appName("json2hive")
                .config("hive.exec.dynamic.partition", "true")
                .config("hive.exec.dynamic.partition.mode", "nonstrict")
                .getOrCreate();
        SparkContext sc = spark.sparkContext();
        JavaSparkContext jsc = new JavaSparkContext(sc);
//        jsc.parallelize()
        String jsonStr = "{\"data\":[{\"name\":\"bym\",\"age\":18},{\"name\":\"tom\",\"age\":20}]}";
        JSONObject message = JSONUtil.parseObj(jsonStr);
        JSONArray data = message.getJSONArray("data");


//        String s = HttpUtil.get("");
//        JSONObject jsonObject = JSONUtil.parseObj(s);
//        JSONArray data = jsonObject.getJSONArray("DATA");
        List<String> list = new ArrayList<>();
        for (int i = 0; i < data.size(); i++) {
            list.add(data.get(i).toString());
        }
        JavaRDD<String> tdd = jsc.parallelize(list);
        Dataset<Row> ds =
                spark.read().json(tdd);

        ds.show(20);

        ds.write().mode(SaveMode.Overwrite).insertInto("ic_gcy_mart.ods_ebgwms_delivery_note_h_25001_tmp");

        spark.stop();
posted @   堕落先锋  阅读(40)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示