摘要: 1. 在类UNIX系统上作为脚本运行在类Unix系统上,你可以设置一个shell前导词来执行脚本。如下例:Script.scala#!/usr/bin/env scala!#println("Hello" + args(0))先输入chmod +x Script.scala,确保对Script.sc... 阅读全文
posted @ 2015-03-09 21:43 ~风轻云淡~ 阅读(2621) 评论(0) 推荐(0) 编辑
摘要: 名词解释RDD全称为ResilientDistributedDataset,弹性分布式数据集。就是分布在集群节点上的数据集,这些集合可以用来进行各种操作。最重要的一点是,某个操作计算后的数据集可以缓存在内存中,然后给其他计算使用,这种在迭代计算中很常见。比如:我们可以从hdfs文件里创建一个数据集,... 阅读全文
posted @ 2015-03-09 16:37 ~风轻云淡~ 阅读(499) 评论(0) 推荐(0) 编辑