Flink 配置 任务提交 内存管理
flink-conf.yaml 如下:
jobmanager.rpc.address: hadoop106 --jobManager 的IP地址 jobmanager.rpc.port: 6123 --jobManager 的端口,默认为6123 jobmanager.heap.mb: 1024M --jobManager 的JVM heap大小 taskmanager.heap.mb: 1024M rest.port: 8081 --taskManager的jvm heap大小设置 taskmanager.numberOfTaskSlots:1 --taskManager中taskSlots个数,最好设置成work节点的CPU个数相等 parallelism.default :1 --并行计算数 fs.default-scheme --文件系统来源 fs.hdfs.hadoopconf: --hdfs置文件路径 jobmanager.web.port -- jobmanager的页面监控端口
slaves
hadoop106
hadoop107
hadoop108
master
hadoop106:8081
内存管理配置
Flink默认上分配taskmanager.heap.mb配置值得70%留它管理,内存的管理让flinK批量处理效果很高;并且flink不会出现OutMemoryException的问题,因为flink知道预留多少内存来执行程序;如果flink运行的程序所需要的内存超过了它所管理的内存,Flink就可以利用磁盘;总而言之,flink的内存管理提高了鲁棒性和系统的速度;下面就介绍管理内存的配置文件:
taskmanager.memory.fraction --管理内存的百分比,默认0.7 taskmanager.memory.size --taskManager 具体管理内存的大小; --此配置重写taskmanager.memory.fraction的配置 taskmanager.memory.segment-size --内存管理器所使用的内存缓冲区的大小和网络堆栈字节 taskmanager.memory.preallocate --taskmanager是否启动时管理所有的内存
- 使用 flink 命令行 直接向 yarn 提交任务
bin/flink run ./examples/batch/WordCount.jar 常用参数: -p 程序默认并行度 下面的参数仅可用于 -m yarn-cluster 模式 -yjm JobManager可用内存,单位兆 -ynm YARN程序的名称 -yq 查询YARN可用的资源 -yqu 指定YARN队列是哪一个 -ys 每个 TaskMananger 会有多少个 Slot(静态,资源浪费,1.11废弃) -ytm 每个TM所在的Container可申请多少内存,单位兆 -yD 动态指定Flink参数
-yD fs.overwrite-files=true 覆盖文件 -yd 分离模式(后台运行,不指定-yd, 终端关闭后,提交的页面打不开)8088页面看作业
-
批处理模式: -Dexecution.runtime-mode=BATCH 部署模式: 集群模式: bin/start-cluster.sh yarn 会话模式: (先启集群后提交,资源0,动态分配) bin/yarnsession.sh -nm name yarn 单作业模式: 早期: -m yarn-cluster 现在:-t yarn-pre-job -c com.ali.WordCount(类名)
-
123
并行度:·每个
operator
可能包含多个子任务(
operator
subtask),
在不同的线程、不同的物理机或不同的容器中,独立执行。
其子任务(subtask)的个数,称为并行度(parallelism)。
1 启动 flink
bin/start-cluster.sh
2 web页面查看
hadoop106:8081
3 运行 WordCount.jar
bin/flink run ./examples/batch/WordCount.jar -m yarn-cluster -Dexecution.runtime-mode=BATCH --input /opt/module/word.txt --output /opt/module/result.txt
4.运行 SocketWindowWordCount 实例
nc -l 9000 /bin/flink run ./examples/streaming/SocketWindowWordCount.jar --port 9000
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报