摘要: 想象下以下场景,嘿嘿...! > 一个iphone用户,闹钟是可以按节假日不响的! > 每日新闻机器人,节假日是可以不打扰我的! > 我的业务,节假日是可以... 阅读全文
posted @ 2023-01-17 10:28 壮壮熊 阅读(1092) 评论(0) 推荐(0) 编辑
摘要: Go读取yaml文件到struct类 阅读全文
posted @ 2023-01-16 20:11 壮壮熊 阅读(517) 评论(0) 推荐(1) 编辑
摘要: 最近看起go lang,真的被go的goroutine(协程)惊艳到了,一句 go function(){#todo},即可完成一个并发的工作。 看到gin这个web框架时,突然就特别想拿它和springboot来做个性能对比,马上撸一遍。 阅读全文
posted @ 2021-05-04 20:50 壮壮熊 阅读(8191) 评论(7) 推荐(0) 编辑

前言

      本文介绍如何在IDEA上快速开发基于Flink框架的DataStream程序。先直接上手!

环境清单

      案例是在win7运行。安装VirtualBox,在VirtualBox上安装Centos操作系统。所有资源都在百度云上,有需要请直接下载。安装教程基本都是傻瓜式,文章不做讲述,有需要直接网上搜索。

资源 版本
VirtualBox 5.2.16
Centos 6.5
Maven 3.6.3
JDK 8u241
IDEA 2019.3.2
Flink 1.10.0

链接:https://pan.baidu.com/s/12rXlY_z_Fck8-NRXdZ5row

提取码:qt2p

轻装上阵

1、IP设置

      Centos的设置静态IP为192.168.2.20,关闭防火墙

1 vi /etc/sysconfig/network-scripts/ifcfg-eth0
2 DEVICE=eth0
3 TYPE=Ethernet
4 ONBOOT=yes #开机启动eth0网卡
5 NM_CONTROLLED=yes
6 BOOTPROTO=static
7 IPADDR=192.168.2.20
8 GATEWAY=192.168.2.1
9 NETMASK=255.255.255.0
     如果此时ping www.baidu.com等不通,需要我们添加dns服务器。
1 [root@localhost network-scripts]# vi /etc/resolv.conf
2 nameserver 192.168.2.1
  重新启动网络服务
1 [root@localhost network-scripts]# service network restart                   
2 正在关闭接口 eth0:[确定]
3 关闭环回接口:[确定]
4 弹出环回接口:[确定]
5 弹出界面 eth0:Determining if ip address 192.168.2.20 is already in use for device eth0...
6                                                            [确定]
      关闭防火墙
1 [root@localhost network-scripts]# service iptables stop

2、创建项目

   在win7的命令行下,用mvn命令创建开发模板

1 mvn archetype:generate -DarchetypeGroupId=org.apache.flink -DarchetypeArtifactId=flink-quickstart-java -DarchetypeVersion=1.10.0
这种方式允许你为新项目命名。它将以交互式的方式询问你项目的 groupId、artifactId 和 package 名称。
用tree命令看下,如下结构。项目是一个 Maven project,它包含了两个类:StreamingJob 和 BatchJob
分别是 DataStream and DataSet 程序的基础骨架程序。main 方法是程序的入口,既可用于IDE测试/执行,也可用于部署。
 1 │  pom.xml
 2 └─src
 3     └─main
 4         ├─java
 5         │  └─com
 6         │      └─ryan
 7         │              BatchJob.java
 8         │              StreamingJob.java
 9         └─resources
10                 log4j.properties
3、写一个自己的DataStream的程序

 功能介绍:WindowWordCount.java,5s为一个时间窗口,摄取数据源的数据,计算单词出现的次数。

 实时数据流计算简易架构图:

为了演示方便,这里我们只演示消息队列和Flink Job两个模块,利用nc工具来替代消息队列作为Flink Job摄取的数据源。

代码:

 1 package com.ryan;
 2 import org.apache.flink.api.common.functions.FlatMapFunction;
 3 import org.apache.flink.api.java.tuple.Tuple2;
 4 import org.apache.flink.streaming.api.datastream.DataStream;
 5 import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
 6 import org.apache.flink.streaming.api.windowing.time.Time;
 7 import org.apache.flink.util.Collector;
 8 public class WindowWordCount {
 9     public static void main(String[] args) throws Exception {
10         StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
11         DataStream<Tuple2<String, Integer>> dataStream = env
12                 .socketTextStream("192.168.2.20", 9999)
13                 .flatMap(new Splitter())
14                 .keyBy(0)
15                 .timeWindow(Time.seconds(5))
16                 .sum(1);
17         dataStream.print();
18         env.execute("Window WordCount");
19     }
20     public static class Splitter implements FlatMapFunction<String, Tuple2<String, Integer>> {
21         @Override
22         public void flatMap(String sentence, Collector<Tuple2<String, Integer>> out) throws Exception {
23             for (String word: sentence.split(" ")) {
24                 out.collect(new Tuple2<String, Integer>(word, 1));
25             }
26         }
27     }
28 }

在centos机器上,命令行启动nc

1 nc -lk 9999

IDEA上直接run main方法,然后在centos机器上,不断输入单词。

1 [ryan@localhost ~]$ nc -lk 9999
2 java
3 java
4 shen
5 深圳 深圳
IDEA控制台上输出如下:

注意:第一次在IDEA上运行这个程序,可能会报如下异常

1 java.lang.NoClassDefFoundError: org/apache/flink/streaming/api/datastream/DataStream

原因是IDEA没有导入flink 的lib下的jar包。导入即可。

4、打包发布到centos平台上的Flink集群

      修改pom.xml文件的mainclass的值为com.ryan.WindowWordCount

1 <mainClass>com.ryan.WindowWordCount</mainClass>

      执行mvn clean install,得到flink-demo-1.0-SNAPSHOT.jar,并上传到centos机器上。

1 mvn clean install

      打开两个centos的控制台,一个用于打开nc,一个用于运行我们打包好的Flink jar包。

1 [ryan@localhost ~]$ nc -lk 9999
2 java
3 shen
4 深圳 深圳 深圳
1 [root@localhost flink-1.10.0]# bin/flink run flink-demo/flink-demo-1.0-SNAPSHOT.jar 
2 Job has been submitted with JobID 9931a9dfc2eddeb2d0b5ed15578bd488
  回到win7上,用浏览器打开http://192.168.2.20:8081/,在Running Jobs上,可以看到一条记录。

 

       在Task Managers上,Stdout模块看到程序输出的结果。

       所有代码都上传到github上,有需要的朋友可以下载

1 https://github.com/qinxiongzhou/flink-demo

       至此,我们完成了开发编译调试到最终上线生产运行。喜欢请关注公众号--程序猿牧场,谢谢!

 

posted @ 2020-03-16 22:54 壮壮熊 阅读(1744) 评论(0) 推荐(1) 编辑
摘要: 服务器上部署了Java服务,出现了OutOfMemoryError,问题应该如何定位? 阅读全文
posted @ 2019-02-11 13:42 壮壮熊 阅读(1544) 评论(6) 推荐(2) 编辑
摘要: 服务器CPU突然告警,如何定位是哪个服务进程导致CPU过载,哪个线程导致CPU过载,哪段代码导致CPU过载? 阅读全文
posted @ 2019-02-10 19:13 壮壮熊 阅读(1986) 评论(4) 推荐(2) 编辑
摘要: Vector是Netflix开源的主机级性能监控框架,向每位工程师的浏览器提供精心挑选的高分辨率系统和应用程序指标。 阅读全文
posted @ 2018-05-14 23:23 壮壮熊 阅读(2203) 评论(0) 推荐(0) 编辑
摘要: Spring IO Platform 作为Spring官网的排位第一的项目,解决Spring项目组合中版本依赖问题。给出的所有依赖都是经过测试,保证可以正常工作。 阅读全文
posted @ 2018-03-04 23:51 壮壮熊 阅读(6811) 评论(0) 推荐(1) 编辑
摘要: run: 这个目标和直接java -jar 来启动基本相同,唯一不同的是java -jar需要打包后才能跑,而run目标不需要。这个当程序编译打包需要比较长时间时,用run目标来跑可以节约时间。 阅读全文
posted @ 2017-09-19 22:25 壮壮熊 阅读(3163) 评论(1) 推荐(2) 编辑
摘要: Spring Boot Maven Plugin插件提供spring boot在maven中的支持。允许你打包可运行的jar包或war包。 repackage目标:创建一个自动可执行的jar或war文件。它可以替换常规的artifact,或者用一个单独的classifier附属在maven构建的生命周期中。 阅读全文
posted @ 2017-09-14 00:21 壮壮熊 阅读(39614) 评论(0) 推荐(5) 编辑
点击右上角即可分享
微信分享提示