2024.7.5

sparkstream

旗本配置
···java

public class SparkStreaming01_Env {
    public static void main(String[] args) throws Exception {

        // TODO 构建环境对象
        //      Spark在流式数据的处理场景中对核心功能环境进行了封装
        SparkConf conf = new SparkConf();
        conf.setMaster("local[*]");
        conf.setAppName("SparkStreaming");

        final JavaStreamingContext jsc = new JavaStreamingContext(conf, new Duration(3 * 1000));

        // TODO 启动数据采集器
        jsc.start();
        // TODO 等待数据采集器的结束，如果采集器停止运行，那么main线程会继续执行
        jsc.awaitTermination();

        // TODO 数据采集器是一个长期执行的任务，所以不能停止，也不能释放资源
        //jsc.close();
//        while ( true ) {}

    }
}

final JavaPairDStream<String, Integer> wordCountDS = wordDS.reduceByKey(Integer::sum);

// TODO DStream确实就是对RDD的封装，但是不是所有的方法都进行了分装。有些方法不能使用：sortBy, sortByKey
//      如果特定场合下，就需要使用这些方法，那么就需要将DStream转换为RDD使用


//wordCountDS.print();
wordCountDS.foreachRDD(
        rdd -> {
            rdd.sortByKey().collect().forEach(System.out::println);
        }
);

```

posted @ 2024-07-05 23:05 258333 阅读(6) 评论(0) 编辑收藏举报

刷新页面返回顶部

258-333

2024.7.5

公告