摘要: rdd有两种操作:transform, actions, transform是lazy设计,只有当有action作用在上面的时候,才会被计算,好处是降低资源消耗,坏处是每次action的时候,transform都要重新计算,解决的办法是讲transformed rdd做一个persist or ca 阅读全文
posted @ 2016-07-20 13:20 怎么也得过啊 阅读(147) 评论(0) 推荐(0) 编辑