spark-shell : local模式

先启动Hadoop(hdfs或其他),在启动spark集群。让spark shell运行在Spark集群上,通过spark-shell附加的参数master的设置就可以使得在spark-shell中运行的程序提交到Spark集群中: spark-shell --master spark://master:7077

 

 

textFile()可以将本地文件或HDFS文件转换成RDD,如果要读取本地文件,各个节点都要有该文件。