会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
骑着鱼去飞
我们不生产代码,我们只不过是代码的搬运工。 --we are never code producers, but just code porters.
博客园
首页
新随笔
联系
订阅
管理
2016年10月19日
通过一系列破坏行为加深对spark RDD 的理解(或者是猜测)(python 版)
摘要: 这个实验由一个实验案例产生,实验中,需要对一个数据集进行维护,其中有一个需要对数据一条条进行插入: 下面是最二的写法: 每次插入数据,新建一个rdd,然后union。 后果是: java.lang.OutOfMemoryError: GC overhead limit exceeded at org
阅读全文
posted @ 2016-10-19 00:34 骑着鱼去飞
阅读(1048)
评论(0)
推荐(0)
编辑
公告
我的QQ:597014772