会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
曹振华
博客园
首页
新随笔
联系
管理
订阅
2016年1月17日
Spark RDD解密
摘要: 1.基于数据集的处理:从物理存储上加载数据,然后操作数据,然后写入数据到物理设备; 基于数据集的操作不适应的场景:不适合于大量的迭代:不适合交互式查询:每次查询都需要对磁盘进行交互.基于数据流的方式不能够复用曾经的结果或者中间的结果;2. RDD弹性数据集特点: A)自动的进行内存和磁盘数据的...
阅读全文
posted @ 2016-01-17 21:41 曹振华
阅读(667)
评论(0)
推荐(0)
编辑
公告