如果汉语背后没有文化,文化背后没有思想,思想背后没有精神,光TMD编造老娘和乔布斯没有说过的话,那中国永远不会是一个伟大的国家。——撒切尔夫人

2021.06.03刘一辰的软件工程随笔

今日目标:

JAVAcheng

 

今日总结:

class WindowWordCount {

    public static void main(String[] args) throws Exception{
        
        SparkConf conf = new SparkConf().setAppName("WindowWordCount");
        
        // create context
        JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(10));
    
        // kafka properties map
        Map<String, String> KafkaParams = new HashMap<String, String>();
        KafkaParams.put("bootstrap.servers", "hserver-1:9092,hserver-2:9092,hserver-3:9092");
        KafkaParams.put("group.id", "WindowWordCount");
        KafkaParams.put("auto.offset.reset", "smallest");
        
        // kafka topic set
        Set<String> topics = new HashSet<String>();
        topics.add(args[0]);
        
        // access data DStream
        JavaPairInputDStream<String, String> SearchLogDStream = 
                KafkaUtils.createDirectStream(
                        jssc, 
                        String.class, 
                        String.class, 
                        StringDecoder.class, 
                        StringDecoder.class, 
                        KafkaParams, 
                        topics
                        );
        
        // flatMap
        JavaDStream<String> WordDSteram = 
                SearchLogDStream.flatMap(
                        
                        new FlatMapFunction<Tuple2<String,String>, String>() {

                            private static final long serialVersionUID = 4034522628037914742L;

                            @Override
                            public Iterator<String> call(Tuple2<String, String> tuple) throws Exception {

                                return Arrays.asList(tuple._2.split(" ")).iterator();
                            }
                        });

明日目标:
mapToPair
posted @   崤函隳  阅读(87)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示