arroyo集群部署简单说明
arroyo 推荐的调度是基于nomad 当然也可以基于内置的
运行配置
- pg
arroyo 基于了refinery 管理迁移 - s3
进行checkpoints 存储,通过controller 以及worker 进行的状态写入
运行服务
arroyo 集群 包含了多特api server 以及一个controller (开源版本)api 暴露grpc (8001端口),web 为8000,如果controller 以及api
分开部署的,需要通过环境变量配置CONTROLLER_ADDR
,默认controller 提供的grpc api 为9190,api 以及controller 都需要配置db
地址,可以通过环境变量维护,同时controller 需要配置s3 信息
prometheus
主要是进行监控
调度
支持多种模式,包含了进程,node,nomad,k8s ,对于调度执行节点,需要配置CONTROLLER_ADDR
使用node 模式controller 需要配置SCHEDULER=node
,nomad 是官方推荐的模式,controller 需要配置SCHEDULER=nomad
以及NOMAD_ENDPOINT
同时建议多个nomad
server 保证ha
说明
arroyo 与k8s 类似又有区别,了解集群部署对于学习内部机制还是有很大帮助的
参考资料
https://doc.arroyo.dev/deployment/arroyo-cluster
https://doc.arroyo.dev/architecture