kalor

导航

 

2014年12月11日

摘要: http://article.yeeyan.org/view/178378/358355 阅读全文
posted @ 2014-12-11 18:42 kalor 阅读(155) 评论(0) 推荐(0) 编辑
 
摘要: 1. RDD-(Resilient Distributed Dataset)弹性分布式数据集 Spark以RDD为核心概念开发的,它的运行也是以RDD为中心。有两种RDD:第一种是并行Collections,它是Scala collection,可以进行并行计算;第二种是Hadoop数据集,它是... 阅读全文
posted @ 2014-12-11 15:33 kalor 阅读(343) 评论(0) 推荐(0) 编辑