Spark学习（二）win10部署Hadoop+Spark

1.Hadoop

基础只需要配置core-site.xml和hdfs-site.xml就行。

参考：

https://www.jianshu.com/p/aa8cfaa26790【这个教程的core-site.xml和hdfs-site.xml的内容弄反了，交换一下就行】

命令行：hadoop namenode -format

启动：进入sbin目录，双击start-dfs.cmd【仅启动dfs】或者start-all.cmd【启动所有，包括yarn】

命令行：jps查看进程

通过http://127.0.0.1:8088/即可查看集群所有节点状态

访问http://localhost:9870/即可查看Hadoop文件管理页面。

我一个单机win10怎么弄另外一个master？！！！百度TMD两天，不如Google一下，我也是醉了！！我发誓，一定养成Google习惯，不是非要英语，而是搜索引擎不行！！

ps：spark提交作业，支持多种 cluster manage 类型：Standalone，Apache Mesos，Hadoop YARN ，Kubernetes，这里采用Standalone的伪分布式。

后来才发现，官方文档https://spark.apache.org/docs/1.6.0/submitting-applications.html也有一丢丢提示，却没给怎么设置！

spark-class2.cmd org.apache.spark.deploy.master.Master

效果：

spark-class2.cmd org.apache.spark.deploy.worker.Worker -c 1 -m 4G spark://192.168.188.1:7077

posted on 2020-07-14 10:21 西伯尔阅读(525) 评论(0) 编辑收藏举报