如何运行Spark集群的Standalone模式

我自己翻译自Spark的官网：http://spark.apache.org/docs/latest/spark-standalone.html#starting-a-cluster-manually

之前看了很多中文资料，看得云里雾里，还不如直接看官网呢！既权威又简洁明了。

Spark集群有三种运行模式：Standalone、Mesos和YARN模式。

现在说Standalone模式。这是最简单的模式，Spark靠自己就能运行这个模式(不依靠其它集群管理工具)。

方法一：手动运行Standalone模式。

前提：Spark各个文件都不做任何修改。

1、在master机器上运行 ./sbin/start-master/sh

运行完之后，会打印出url: spark://HOST:PORT ，这个就是当前master的Spark URL。

2、在slave机器上运行 ./sbin/start-slave.sh <master-spark-url>

然后在Master的管理界面上查看http://master-ip:8080，查看slave是否已上线。

方法二：使用集群运行脚本运行Standalone模式。

前提：master节点去访问slave节点需要使用ssh无密码登录，因此需要提前配置无密码登录。

1、在master的conf文件夹下新增slaves文件。slaves文件里存放着每一个slave节点的hostname，每行一个。

2、在master节点上运行如下脚本即可：

完毕。

posted @ 2016-04-04 21:15 guaidaoK的博客阅读(1115) 评论(0) 编辑收藏举报

刷新页面返回顶部

guaidaoK的博客