会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
郑汉润
博客园
首页
新随笔
联系
订阅
管理
2021年3月14日
二、Spark架构与运行流程
摘要: 1、为什么要引入Yarn和Spark。 (1)现有的hadoop生态系统中存在的问题 1)使用mapreduce进行批量离线分析; 2)使用hive进行历史数据的分析; 3)使用hbase进行实时数据的查询; 4)使用storm进行实时的流处理; (2)选用spark的原因 1) 应用于流式计算的S
阅读全文
posted @ 2021-03-14 21:12 郑汉润
阅读(79)
评论(0)
推荐(0)
编辑
公告