摘要: 并行化scala集合(Parallelize)//加载数据1~10val num=sc.parallelize(1 to 10)//每个数据项乘以2,注意 _*2记为一个函数(fun) val doublenum = num.map(_*2) //内存缓存数据doublenum.cache() //... 阅读全文
posted @ 2014-10-02 21:31 会飞的纸盒 阅读(1423) 评论(0) 推荐(0) 编辑
摘要: 最近想对自己学的东西做些回顾,想到写博客是个不错的方式,方便他人也有利自己,刚开始写不足之处大家多担待。编译前需要安装JDK1.6以上、scala、Maven、Ant、hadoop2.20 如下图(/etc/profile):Spark编译有提供了两种方式:Maven编译:在 /etc/profil... 阅读全文
posted @ 2014-10-02 20:50 会飞的纸盒 阅读(431) 评论(0) 推荐(0) 编辑