摘要: Hadoop YARN同时支持内存和CPU两种资源的调度,本文介绍如何配置YARN对内存和CPU的使用。 YARN作为一个资源调度器,应该考虑到集群里面每一台机子的计算资源,然后根据application申请的资源进行分配Container。Container是YARN里面资源分配的基本单位,具有一 阅读全文
posted @ 2017-01-25 16:14 MrMrCash 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 本文主要了解Spark On YARN部署模式下的内存分配情况,因为没有深入研究Spark的源代码,所以只能根据日志去看相关的源代码,从而了解“为什么会这样,为什么会那样”。 说明 按照Spark应用程序中的driver分布方式不同,Spark on YARN有两种模式: yarn-client模式 阅读全文
posted @ 2017-01-25 16:12 MrMrCash 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 以下是整理的Spark中的一些配置参数,官方文档请参考Spark Configuration。 Spark提供三个位置用来配置系统: Spark属性:控制大部分的应用程序参数,可以用SparkConf对象或者Java系统属性设置 环境变量:可以通过每个节点的 conf/spark-env.sh脚本设 阅读全文
posted @ 2017-01-25 16:10 MrMrCash 阅读(904) 评论(0) 推荐(0) 编辑