会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
哥们要飞的blog
Nice to meet you!
博客园
首页
新随笔
联系
订阅
管理
2021年11月22日
【Spark】Day04-Spark Streaming:与离线批量比较、架构特点、入门案例、创建(队列、数据源)、转换(有状态、无状态)、输出方式、进阶(累加、转换为DF、缓存持久化)、实战(窗口统计)
摘要: 一、概述 1、离线和实时计算 离线:数据量大,数据不会变化,MapReduce 实时:数据量小,计算过程要短 2、批量和流式处理 批量:冷数据,数据量大,速度慢 流:在线、实时产生的数据(快速持续到达) 3、Spark Streaming介绍 支持大量输入输出数据源的流式处理 数据输入后可以使用sp
阅读全文
posted @ 2021-11-22 22:40 哥们要飞
阅读(158)
评论(0)
推荐(0)
编辑
公告