摘要: 背景 Apache Beam 是Google 开源的一个统一编程框架,它本身不是一个流式处理平台,而是提供了统一的编程模型,帮助用户创建自己的数据处理流水线,实现可以运行在任意执行引擎之上批处理和流式处理任务。它包含: 一个可以涵盖批处理和流处理的统一编程模型 Beam SDK,支持 Java 和 阅读全文
posted @ 2019-06-28 10:29 seer1 阅读(516) 评论(0) 推荐(0) 编辑
摘要: Apache Beam(原名Google DataFlow)是Google在2016年2月份贡献给Apache基金会的Apache孵化项目,被认为是继MapReduce,GFS和BigQuery等之后,Google在大数据处理领域对开源社区的又一个非常大的贡献。Apache Beam的主要目标是统一 阅读全文
posted @ 2019-06-28 10:27 seer1 阅读(292) 评论(0) 推荐(0) 编辑