2021 年 11月 22 日随笔档案 - 哥们要飞

2021年11月22日

【Spark】Day04-Spark Streaming：与离线批量比较、架构特点、入门案例、创建（队列、数据源）、转换（有状态、无状态）、输出方式、进阶（累加、转换为DF、缓存持久化）、实战（窗口统计）

摘要：一、概述 1、离线和实时计算离线：数据量大，数据不会变化，MapReduce 实时：数据量小，计算过程要短 2、批量和流式处理批量：冷数据，数据量大，速度慢流：在线、实时产生的数据（快速持续到达） 3、Spark Streaming介绍支持大量输入输出数据源的流式处理数据输入后可以使用sp 阅读全文

posted @ 2021-11-22 22:40 哥们要飞阅读(158) 评论(0) 推荐(0) 编辑

哥们要飞的blog

Nice to meet you!

公告