（四）Flink部署方式以及高可用

方式一：Local模式

后续补充......

方式二：Standalone cluster

后续补充......

方式三：Flink on Yarn

　　两种部署方式比较：

第一种方式启动命令的一些参数说明：

　　./bin/yarn-session.sh 命令用法：

　　必选： -n,--container <arg> 分配多少个yarn容器 (=taskmanager的数量)

　　可选：

　　　　-D <arg> 动态属性　

　　　　-d,--detached 独立运行

　　　　-jm,--jobManagerMemory <arg> JobManager的内存 [in MB]

　　　　-nm,--name 在YARN上为一个自定义的应用设置一个名字

　　　　-q,--query 显示yarn中可用的资源 (内存, cpu核数)

　　　　-qu,--queue <arg> 指定YARN队列.

　　　　-s,--slots <arg> 每个TaskManager使用的slots数量

　　　　-tm,--taskManagerMemory <arg> 每个TaskManager的内存 [in MB]

　　　　-z,--zookeeperNamespace <arg> 针对HA模式在zookeeper上创建NameSpace

　　　　-id,--applicationId <yarnAppId> YARN集群上的任务id，附着到一个后台运行的yarn session中

第二种方式启动命令的一些参数说明：

　　 ./bin/flink run 命令用法J：

　　　run [OPTIONS] <jar-file> <arguments>

　　　　"run" 操作参数:

　　　　　　-c,--class <classname> 如果没有在jar包中指定入口类，则需要在这里通过这个参数指定

　　　　　　-m,--jobmanager <host:port> 指定需要连接的jobmanager(主节点)地址，使用这个参数可以指定一个不同于配置文件中的jobmanager

　　　　　　 -p,--parallelism <parallelism> 指定程序的并行度。可以覆盖配置文件中的默认值。

　　　默认查找当前yarn集群中已有的yarn-session信息中的jobmanager【/tmp/.yarn-properties-root】：

　　　　 ./bin/flink run ./examples/batch/WordCount.jar -input hdfs://hostname:port/hello.txt -output hdfs://hostname:port/result1

　　　连接指定host和port的jobmanager：

　　　　 ./bin/flink run -m hadoop100:1234 ./examples/batch/WordCount.jar -input hdfs://hostname:port/hello.txt -output hdfs://hostname:port/result1

　　启动一个新的yarn-session：

　　　　 ./bin/flink run -m yarn-cluster -yn 2 ./examples/batch/WordCount.jar -input hdfs://hostname:port/hello.txt -output hdfs://hostname:port/result1

　　　　注意：yarn session命令行的选项也可以使用./bin/flink 工具获得。它们都有一个y或者yarn的前缀

　　　　例如：./bin/flink run -m yarn-cluster -yn 2 ./examples/batch/WordCount.jar

其他部署方式：Mesos；Docker；Kubernetes；AWS；Goole Compute Engine；MapR

HA:

本质也就是JobManager 高可用(HA)，JobManager协调每个flink任务部署。它负责任务调度和资源管理。默认情况下，每个flink集群只有一个JobManager，这将导致一个单点故障(SPOF)：如果JobManager挂了，则不能提交新的任务，并且运行中的程序也会失败。使用JobManager HA，集群可以从JobManager故障中恢复，从而避免SPOF(单点故障) 。用户可以在standalone或 YARN集群模式下，配置集群高可用。

JobManager HA配置：

1、Standalone集群的高可用

Standalone模式（独立模式）下JobManager的高可用性的基本思想是，任何时候都有一个 Master JobManager ，并且多个Standby JobManagers 。 Standby JobManagers可以在Master JobManager 挂掉的情况下接管集群成为Master JobManager。这样保证了没有单点故障，一旦某一个Standby JobManager接管集群，程序就可以继续运行。 Standby JobManager和Master JobManager实例之间没有明确区别。每个JobManager都可以成为Master或Standby节点。

2、Yarn 集群高可用

flink on yarn的HA 其实主要是利用yarn自己的job恢复机制。

HA参见：https://www.cnblogs.com/wynjauu/articles/10545128.html

转载请注明地址：https://www.cnblogs.com/wynjauu/articles/10543833.html

posted @ 2019-03-16 19:01 舞羊阅读(3268) 评论(0) 编辑收藏举报

刷新页面返回顶部

舞羊

当你的才华还撑不起你的野心时，你就应该静下心来学习。

（四）Flink部署方式以及高可用

公告