spark RDD transformation的mapValues、subtract、sample、takeSample详解--(视频笔记)

mapValues

针对key-value类型的value进行操作,不会对key进行操作。
maValue(a=>a+2) 所有的value 都变成value+2

subtract
对两个RDD进行运算 A∪B - A∩B

sample
对RDD进行采样,输入RDD,返回采样RDD
fraction 百分比
seed

takeSample详解
num 采样的个数
seed
针对RDD进行采样,返回的不是RDD,返回的是结果。
类似collect

posted @ 2015-12-29 14:10  逸新  阅读(817)  评论(0编辑  收藏  举报