会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
夏日的向日葵
博客园
首页
新随笔
联系
订阅
管理
2021年1月14日
离线批处理之Spark
摘要: Spark简介 Spark是基于内存的分布式批处理系统,它把任务拆分,然后分配到多个的CPU上进行处理,处理数据时产生的中间产物(计算结果)存放在内存中,减少了对磁盘的I/O操作,大大的提升了数据的处理速度,在数据处理和数据挖掘方面比较占优势。 Spark应用场景 数据处理(Data Process
阅读全文
posted @ 2021-01-14 23:04 夏日的向日葵
阅读(1569)
评论(0)
推荐(0)
编辑
公告