Beam概念学习系列之Pipeline Runners

　　不多说，直接上干货！

https://beam.apache.org/get-started/beam-overview/

　　在 Beam 管道上运行引擎会根据你选择的分布式处理引擎，其中兼容的 API 转换你的 Beam 程序应用，让你的 Beam 应用程序可以有效的运行在指定的分布式处理引擎上。因而，当运行 Beam 程序的时候，你可以按照自己的需求选择一种分布式处理引擎。当前 Beam 支持的管道运行引擎有以下几种：

Apache Apex
Apache Flink
Apache Spark
Google Cloud Dataflow

　　即，一个 Beam 程序可以运行在多个 Beam 的可执行引擎上，包括 ApexRunner，FlinkRunner，SparkRunner 或者 DataflowRunner。另外还有 DirectRunner。不需要特殊的配置就可以在本地执行，方便测试使用。

Beam编程系列之Java SDK Quickstart（官网的推荐步骤）

posted @ 2017-09-29 10:11 大数据和AI躺过的坑阅读(653) 评论(0) 编辑收藏举报

刷新页面返回顶部

大数据和人工智能躺过的坑

Beam概念学习系列之Pipeline Runners

Beam编程系列之Java SDK Quickstart（官网的推荐步骤）

公告