Hadoop(26)yarn的三种任务调度器
yarn的任务调度器
资源调度器是YARN
最核心的组件之一,是一个插拔式的服务组件,负责整个集群资源的管理和分配。YARN提供了三种可用的资源调度器:FIFO、Capacity Scheduler、Fair Scheduler。
先进先出调度器(FIFO)
FIFO
按照先到先得的原则,进行分配资源。这种调度器已经基本被淘汰了,因为比如说job1
运行完成需要24小时,job2
运行完成只需要1分钟,但是job2
依然需要等job1
运行完成才可以开始运行,效率很低。
容量调度器(Capacity Scheduler)
apache
版本的Hadoop
默认使用容量容量调度器。容量解决了FIFO调度器效率低下的问题,但依然是要以队列为基础的。
因此,首先要设计容量调度器资源分配队列,通过xml
文件配置这些信息。假如有个资源分配队列如下:
集群60%
的资源分配给dev
队列,集群40%
的资源分配给prod
队列,dev
队列的资源专门给开发组的任务分配,prod
队列的资源专门给生产组的任务分配。
现在有个job1
要运行,把它放在spark
队列里运行,除了spark
队列,现在其它队列都没有job
要运行。在spark队列内部使用FIFO
调度策略,还有其它job
进入spark
队列的话,就在job1
后排队等待。如果spark
队列的资源足够job1
运行 ,直接运行就行。如果spark
队列资源不够job1
运行,spark
会弹性占用hdp
队列的资源,从而spark
拥有集群60%
的资源,hdp
h队列拥有0%资源。如果60%
还是不够,则spark
队列会继续扩张资源,但是不能无底洞地扩张,我们可以设置个上限,比如75%
。
扩张前:
扩展后:
公平调度器(Fair Scheduler)
cdh
版本的hadoop
默认使用公平调度器。公平调度器也是以队列为基础。
单个队列里的公平:
假如说job1
一开始分配到了某个队列里100%
的资源,如果后来job2
后来也进入该队列,则job2
会先等待job1
一小段时间,让job1
释放该队列50%
的资源给job2
。如果后来job2
运行完成了,但是job1
依旧没运行完,则job1
又会重新占用该队列所有的资源。示意图如下:
队列间的公平:
假设有AB
两个队列,一开始job1
进入队列A
,队列B
此时没有job,
那么job1
不仅会占用队列A
的所有资源,还有占用B
的所有资源。接着,job2
也提交上来了,job2
首先会等待小会,让job1
释放50%
的资源,然后再利用这些资源开始运行。后来,job3
也提交上来了,job3
也首先会等待job1
释放50%
的资源,然后再利用这些资源开始运行。
可以看到,这个过程,job1
和job2
是平分对半资源,后来job3
进入后,job2
又和job3
平分资源。所以说,job1
被分配到的资源是最多的,紧接着是job2
和job3
。
优先级:
从上面可知,先进入队列里先运行的job
会享受到更多的资源,那么如果一个队列里有多个job
,谁会被优先运行?
在资源有限情况下,每个job
理想情况下获得的计算资源与实际获得的计算资源存在一种差距,这个差距就叫做缺额。同一个队列里,job
的资源缺额越大,越先获得资源优先执行,但每个job都会分配到资源,确保公平,因此可以看到多个作业同时运行。这个是Fair
模式,如果想要某个队列使用FIFO
策略调度,可以进行设置。
hadoop默认队列
前面我们看到了hadoop
当中有各种资源调度形式,当前hadoop
的任务提交,默认提交到default
队列里面去了,将所有的任务都提交到default
队列,我们在实际工作当中,可以通过划分队列的形式,对不同的用户,划分不同的资源,让不同的用户的任务,提交到不同的队列里面去,实现资源的隔离
通过8088端口(node:8088)查看:
资源隔离
资源隔离目前有2种,静态隔离和动态隔离。
静态隔离
所谓静态隔离是以服务隔离,是通过cgroups(LINUX control groups)
功能来支持的。比如HADOOP
服务包含HDFS, HBASE, YARN
等等,那么我们固定的设置比例,HDFS:20%, HBASE:40%, YARN:40%
, 系统会帮我们根据整个集群的CPU,内存,IO
数量来分割资源,先提一下,IO
是无法分割的,所以只能说当遇到IO问题时根据比例由谁先拿到资源,CPU和内存是预先分配好的。
上面这种按照比例固定分割就是静态分割了,仔细想想,这种做法弊端太多,假设我按照一定的比例预先分割好了,但是如果我晚上主要跑mapreduce
, 白天主要是HBASE
工作,这种情况怎么办? 静态分割无法很好的支持,缺陷太大。
动态隔离
动态隔离只要是针对 YARN
以及impala
, 所谓动态只是相对静态来说,其实也不是动态。 先说YARN
, 在HADOOP
整个环境,主要服务有哪些? mapreduce
(这里再提一下,mapreduce
是应用,YARN
是框架,搞清楚这个概念),HBASE, HIVE,SPARK,HDFS,IMPALA
, 实际上主要的大概这些,很多人估计会表示不赞同,oozie, ES, storm , kylin,flink
等等这些和YARN
离的太远了,不依赖YARN
的资源服务,而且这些服务都是单独部署就OK
,关联性不大。 所以主要和YARN
有关也就是HIVE, SPARK,Mapreduce
。这几个服务也正式目前用的最多的(HBASE
用的也很多,但是和YARN
没啥关系)。
根据上面的描述,大家应该能理解为什么所谓的动态隔离主要是针对YARN
。好了,既然YARN
占的比重这么多,那么如果能很好的对YARN
进行资源隔离,那也是不错的。如果我有3个部分都需要使用HADOOP,那么我希望能根据不同部门设置资源的优先级别,实际上也是根据比例来设置,建立3个queue name
, 开发部们30%
,数据分析部分50%
,运营部门20%
。
设置了比例之后,再提交JOB
的时候设置mapreduce.queue.name
,那么JOB
就会进入指定的队列里面。 非常可惜的是,如果你指定了一个不存在的队列,JOB
仍然可以执行,这个是目前无解的,默认提交JOB
到YARN
的时候,规则是root.users.username
, 队列不存在,会自动以这种格式生成队列名称。 队列设置好之后,再通过ACL
来控制谁能提交或者KIll job
。
隔离方式选择
从上面2种资源隔离来看,没有哪一种做的很好,如果非要选一种,我会选取后者,隔离YARN资源, 第一种固定分割服务的方式实在支持不了现在的业务。
自定义队列
需求:现在一个集群当中,可能有多个用户都需要使用,例如开发人员需要提交任务,测试人员需要提交任务,以及其他部门工作同事也需要提交任务到集群上面去,对于我们多个用户同时提交任务,我们可以通过配置yarn
的多用户资源隔离来进行实现
第一步:node01编辑yarn-site.xml
node01
修改yarn-site.xml
添加以下配置
cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop
vim yarn-site.xml
<!-- 指定我们的任务调度使用fairScheduler的调度方式 -->
<property>
<name>yarn.resourcemanager.scheduler.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>
<!-- 指定我们的任务调度的配置文件路径 -->
<property>
<name>yarn.scheduler.fair.allocation.file</name>
<value>/kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop/fair-scheduler.xml</value>
</property>
<!-- 是否启用资源抢占,如果启用,那么当该队列资源使用
yarn.scheduler.fair.preemption.cluster-utilization-threshold 这么多比例的时候,就从其他空闲队列抢占资源
-->
<property>
<name>yarn.scheduler.fair.preemption</name>
<value>true</value>
</property>
<property>
<name>yarn.scheduler.fair.preemption.cluster-utilization-threshold</name>
<value>0.8f</value>
</property>
<!-- 默认提交到default队列 -->
<property>
<name>yarn.scheduler.fair.user-as-default-queue</name>
<value>true</value>
<description>default is True</description>
</property>
<!-- 如果提交一个任务没有到任何的队列,是否允许创建一个新的队列,设置false不允许 -->
<property>
<name>yarn.scheduler.fair.allow-undeclared-pools</name>
<value>false</value>
<description>default is True</description>
</property>
第二步:node01添加fair-scheduler.xml配置文件
node01
执行以下命令,添加faie-scheduler.xml
的配置文件
cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop
vim fair-scheduler.xml
复制下列内容到集群配置文件的时候,特别注意有没有全部复制了,之前就因为漏复制了一点内容,导致ResourceManager
启动不了。
<?xml version="1.0"?>
<allocations>
<!-- users max running apps -->
<userMaxAppsDefault>30</userMaxAppsDefault>
<!-- 定义我们的队列 -->
<queue name="root">
<minResources>512mb,4vcores</minResources>
<maxResources>102400mb,100vcores</maxResources>
<maxRunningApps>100</maxRunningApps>
<weight>1.0</weight>
<schedulingMode>fair</schedulingMode>
<aclSubmitApps> </aclSubmitApps>
<aclAdministerApps> </aclAdministerApps>
<queue name="default">
<minResources>512mb,4vcores</minResources>
<maxResources>30720mb,30vcores</maxResources>
<maxRunningApps>100</maxRunningApps>
<schedulingMode>fair</schedulingMode>
<weight>1.0</weight>
<!-- 所有的任务如果不指定任务队列,都提交到default队列里面来 -->
<aclSubmitApps>*</aclSubmitApps>
</queue>
<!--
weight:资源池权重
aclSubmitApps:允许提交任务的用户名和组;
格式为: 用户名 用户组
当有多个用户时候,格式为:用户名1,用户名2 用户名1所属组,用户名2所属组
aclAdministerApps:允许管理任务的用户名和组;
格式同上。
-->
<queue name="hadoop">
<minResources>512mb,4vcores</minResources>
<maxResources>20480mb,20vcores</maxResources>
<maxRunningApps>100</maxRunningApps>
<schedulingMode>fair</schedulingMode>
<weight>2.0</weight>
<aclSubmitApps>hadoop hadoop</aclSubmitApps>
<aclAdministerApps>hadoop hadoop</aclAdministerApps>
</queue>
<queue name="develop">
<minResources>512mb,4vcores</minResources>
<maxResources>20480mb,20vcores</maxResources>
<maxRunningApps>100</maxRunningApps>
<schedulingMode>fair</schedulingMode>
<weight>1</weight>
<aclSubmitApps>develop develop</aclSubmitApps>
<aclAdministerApps>develop develop</aclAdministerApps>
</queue>
<queue name="test1">
<minResources>512mb,4vcores</minResources>
<maxResources>20480mb,20vcores</maxResources>
<maxRunningApps>100</maxRunningApps>
<schedulingMode>fair</schedulingMode>
<weight>1.5</weight>
<aclSubmitApps>test1,hadoop,develop test1</aclSubmitApps>
<aclAdministerApps>test1 group_businessC,supergroup</aclAdministerApps>
</queue>
</queue>
</allocations>
第三步:将修改后的配置文件拷贝到其他机器上
将node01
修改后的yarn-site.xml
和fair-scheduler.xml
配置文件分发到其他服务器上面去
cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop
[root@node01 hadoop]# scp yarn-site.xml fair-scheduler.xml node02:$PWD
[root@node01 hadoop]# scp yarn-site.xml fair-scheduler.xml node03:$PWD
第四步:重启yarn集群
修改完yarn-site.xml
配置文件之后,重启yarn
集群,node01
执行以下命令进行重启
[root@node01 hadoop]# cd /kkb/install/hadoop-2.6.0-cdh5.14.2/
[root@node01 hadoop-2.6.0-cdh5.14.2]# sbin/stop-yarn.sh
[root@node01 hadoop-2.6.0-cdh5.14.2]# sbin/start-yarn.sh
重新登陆node01:80088,可以看到,已经新增了几个队列。
指定任务提交的队列
指定mapreduce任务的提交队列:
修改代码,添加我们mapreduce
任务需要提交到哪一个队列里面去
//在组装类的run方法里添加以下内容:
Configuration configuration = new Configuration();
configuration.set("mapred.job.queue.name", "develop"); //第二个参数是要指定的队列名称
指定hive任务的提交队列:
hive-site.xml
<property>
<name>mapreduce.job.queuename</name>
<value>test1</value>
</property>
指定spark任务提交的队列
1- 脚本方式
--queue hadoop
2- 代码方式
saprkConf.set("yarn,spark.queue", "develop")