理解Spark的RDD
摘要:
RDD是个抽象类,定义了诸如map()、reduce()等方法,但实际上继承RDD的派生类一般只要实现两个方法:def getPartitions: Array[Partition]def compute(thePart: Partition, context: TaskContext): Next... 阅读全文
posted @ 2014-11-23 20:57 白乔 阅读(230) 评论(0) 推荐(0) 编辑
posted @ 2014-11-23 20:57 白乔 阅读(230) 评论(0) 推荐(0) 编辑
posted @ 2014-11-23 18:14 白乔 阅读(203) 评论(0) 推荐(0) 编辑
posted @ 2014-11-23 15:14 白乔 阅读(157) 评论(0) 推荐(0) 编辑