摘要:
概述 Apache Flink是一个框架和分布式处理引擎,用于在无界和有界数据流上进行有状态的计算 Unbounded streams(无界流)有一个起点,但没有定义的终点。它们不会终止,而且会源源不断的提供数据。无边界的流必须被连续地处理,即事件达到后必须被立即处理。等待所有输入数据到达是不可能的 阅读全文
摘要:
Spark是什么 Apache Spark是一个分布式、内存级计算框架, 是一个大数据处理框架 基本概念 Application:用户编写的Spark应用程序。 Driver:Spark中的Driver即运行上述Application的main函数并创建SparkContext,创建SparkCon 阅读全文