摘要: 概述 Apache Flink是一个框架和分布式处理引擎,用于在无界和有界数据流上进行有状态的计算 Unbounded streams(无界流)有一个起点,但没有定义的终点。它们不会终止,而且会源源不断的提供数据。无边界的流必须被连续地处理,即事件达到后必须被立即处理。等待所有输入数据到达是不可能的 阅读全文
posted @ 2023-03-14 20:34 codeBetter1993 阅读(39) 评论(0) 推荐(0) 编辑
摘要: Spark是什么 Apache Spark是一个分布式、内存级计算框架, 是一个大数据处理框架 基本概念 Application:用户编写的Spark应用程序。 Driver:Spark中的Driver即运行上述Application的main函数并创建SparkContext,创建SparkCon 阅读全文
posted @ 2023-03-14 19:23 codeBetter1993 阅读(31) 评论(0) 推荐(0) 编辑