关闭页面特效

项目实战从 0 到 1 学习之Flink（19） Flink 读取Kafka生成的数据，并进行汇总

今天介绍用 Flink 读取Kafka生成的数据，并进行汇总的案例

第一步：环境准备，kafka，flink，zookeeper。我这边是用的CDH环境，kafka跟zookeeper 都安装完毕，并测试可以正常使用

第二步：用kafka创建一个生产者进行消息生产

./kafka-console-producer.sh --broker-list 192.168.58.177:9092 --topic my_topic

3. 第三步：在idea里面创建一个flink项目。代码如下：

StreamExecutionEnvironment Env = StreamExecutionEnvironment.getExecutionEnvironment();
 
   Properties properties = new Properties();
   properties.setProperty("bootstrap.servers", "192.168.58.177:9092");
   properties.setProperty("zookeeper.connect", "192.168.58.171:2181,192.168.58.177:2181");
   properties.setProperty("group.id", "test");
 
   FlinkKafkaConsumer<String> myConsumer = new FlinkKafkaConsumer<String>("my_topic",new SimpleStringSchema(),properties);
 
   myConsumer.setStartFromLatest();
   myConsumer.setStartFromGroupOffsets();
 
 
   Env.setParallelism(2).setStreamTimeCharacteristic(TimeCharacteristic.EventTime);
 
   DataStream<Tuple2<String,Integer>> stream = Env.addSource(myConsumer)
           .flatMap((String lines, Collector<Tuple2<String,Integer>> out) ->
                   Stream.of(lines.split(","))
                   .forEach(a -> out.collect(Tuple2.of(a,1))))
           .returns(Types.TUPLE(Types.STRING,Types.INT))
           .keyBy(0)
           //.window(TumblingEventTimeWindows.of(Time.seconds(5)))
           .sum(1)
           ;
 
   //stream.writeAsText("C:\\Users\\yaowentao\\Desktop\\a");
   stream.print();
   Env.execute("my first stream flink");

第四步：返回kafka进行消息输入，并观察控制台是否有数据输出

这样就能初步实现 flink读取kafka的消息

posted on 2020-09-08 15:27 大码王阅读(738) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

青青陵上柏，磊磊涧中石f

运行时长：2258天0小时56分47秒

您的浏览器不兼容canvas

昵称：大码王
园龄： 5年8个月
粉丝： 233
关注： 30

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (719)

clickhouse(4)

flink源码分析(2)

Groovy(1)

Java(34)

Linux(3)

office(10)

OpenStack入门(1)

Phoenix+hbase(11)

photoshop(10)

python之绘图(7)

python之爬虫(15)

python之入门到实战(26)

shell大全(1)

SparkCore(14)

sparkGraphx(2)

sparksql(8)

sparkstreaming(17)

spark源码分析(11)

博客园美化(6)

操作系统(1)

随笔档案 (693)

2024年5月(4)

2024年3月(3)

2023年9月(1)

2023年4月(2)

2023年3月(4)

2023年2月(1)

2022年12月(1)

2022年11月(1)

2022年9月(2)

2022年8月(17)

2022年7月(5)

2022年5月(3)

2022年4月(18)

2021年9月(1)

2021年6月(9)

2021年5月(19)

2021年2月(1)

2021年1月(17)

2020年12月(7)

2020年11月(19)

文章分类 (35)

airflow(4)

azkban(1)

canal(1)

Cassandra(1)

datax(1)

druid(1)

Elasticsearch(8)

java(11)

mongodb(2)

redis(3)

scala(2)

文章档案 (40)

2024年4月(2)

2023年5月(2)

2023年4月(1)

2023年1月(1)

2020年6月(9)

2020年5月(25)

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (719)

随笔档案 (693)

文章分类 (35)

文章档案 (40)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏