package example

import org.apache.spark._
import SparkContext._
object WordCount {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("worldCount")
    val sc = new SparkContext(conf)
    val textFile = sc.textFile(args(0))
    val result = textFile.flatMap(line => line.split(" "))
        .map(word => (word, 1)).reduceByKey(_+_)
    result.saveAsTextFile(args(1))
  }
}

将程序导出为jar包，拷贝至linux上，执行命令：

./spark-submit --class example.WordCount --master spark://192.168.1.241:7077 /opt/word-count.jar  /opt/spark/README.md  /opt/result

运行结果：

注意：搭建spark集群时，最好选择spark-with-hadoop，否则会出现缺少hadoop jar 包的问题

posted on 2016-10-17 17:00 miss_UU 阅读(10165) 评论(0) 编辑收藏举报

刷新页面返回顶部

导航