随笔分类 - Flink入门与进阶
摘要:Apache Flink是一个框架和分布式处理引擎,用于对有界和无界数据流进行状态计算。 处理的是源源不断的实时数据流。从外部实时读取数据,对数据做流或者批数据分析,供应用。 批处理:数据攒够了一批处理一批,比如Hive,数据库,Spark等传统的数据处理方式。批处理的场景就像跟美女发邮件,一次可以
阅读全文
摘要:1,简介 Flink是Apache基金会旗下的一个开源大数据处理框架。Flink很牛逼,好多牛逼的公司都在用。 2,特征 *高吞吐和低延迟。每秒处理百万个时间,毫秒级延迟。有点既要老婆好,又要彩礼少的意思。 *结果准确性。这个好像不用说,结果不准确还要拿来做什么。不过为了保证结果的准确性,实际处理还
阅读全文