Hadoop(26)yarn的三种任务调度器

yarn的任务调度器

资源调度器是YARN最核心的组件之一,是一个插拔式的服务组件,负责整个集群资源的管理和分配。YARN提供了三种可用的资源调度器:FIFO、Capacity Scheduler、Fair Scheduler。

先进先出调度器(FIFO)

FIFO按照先到先得的原则,进行分配资源。这种调度器已经基本被淘汰了,因为比如说job1运行完成需要24小时,job2运行完成只需要1分钟,但是job2依然需要等job1运行完成才可以开始运行,效率很低。

image-20200216051214661

容量调度器(Capacity Scheduler)

apache版本的Hadoop默认使用容量容量调度器。容量解决了FIFO调度器效率低下的问题,但依然是要以队列为基础的。

因此,首先要设计容量调度器资源分配队列,通过xml文件配置这些信息。假如有个资源分配队列如下:

image-20200216183901319

集群60%的资源分配给dev队列,集群40%的资源分配给prod队列,dev队列的资源专门给开发组的任务分配,prod队列的资源专门给生产组的任务分配。

现在有个job1要运行,把它放在spark队列里运行,除了spark队列,现在其它队列都没有job要运行。在spark队列内部使用FIFO调度策略,还有其它job进入spark队列的话,就在job1后排队等待。如果spark队列的资源足够job1运行 ,直接运行就行。如果spark队列资源不够job1运行,spark会弹性占用hdp队列的资源,从而spark拥有集群60%的资源,hdph队列拥有0%资源。如果60%还是不够,则spark队列会继续扩张资源,但是不能无底洞地扩张,我们可以设置个上限,比如75%

扩张前:

image-20200216184201871

扩展后:

image-20200216190012943

公平调度器(Fair Scheduler)

cdh版本的hadoop默认使用公平调度器。公平调度器也是以队列为基础。

单个队列里的公平:

假如说job1一开始分配到了某个队列里100%的资源,如果后来job2后来也进入该队列,则job2会先等待job1一小段时间,让job1释放该队列50%的资源给job2。如果后来job2运行完成了,但是job1依旧没运行完,则job1又会重新占用该队列所有的资源。示意图如下:

image-20200216203812431

队列间的公平:

假设有AB两个队列,一开始job1进入队列A,队列B此时没有job,那么job1不仅会占用队列A的所有资源,还有占用B的所有资源。接着,job2也提交上来了,job2首先会等待小会,让job1释放50%的资源,然后再利用这些资源开始运行。后来,job3也提交上来了,job3也首先会等待job1释放50%的资源,然后再利用这些资源开始运行。

可以看到,这个过程,job1job2是平分对半资源,后来job3进入后,job2又和job3平分资源。所以说,job1被分配到的资源是最多的,紧接着是job2job3

image-20200216205357255

优先级:

从上面可知,先进入队列里先运行的job会享受到更多的资源,那么如果一个队列里有多个job,谁会被优先运行?

在资源有限情况下,每个job理想情况下获得的计算资源与实际获得的计算资源存在一种差距,这个差距就叫做缺额。同一个队列里,job的资源缺额越大,越先获得资源优先执行,但每个job都会分配到资源,确保公平,因此可以看到多个作业同时运行。这个是Fair模式,如果想要某个队列使用FIFO策略调度,可以进行设置。

image-20200216203933427

hadoop默认队列

前面我们看到了hadoop当中有各种资源调度形式,当前hadoop的任务提交,默认提交到default队列里面去了,将所有的任务都提交到default队列,我们在实际工作当中,可以通过划分队列的形式,对不同的用户,划分不同的资源,让不同的用户的任务,提交到不同的队列里面去,实现资源的隔离

通过8088端口(node:8088)查看:

image-20200216213243450

资源隔离

资源隔离目前有2种,静态隔离和动态隔离。

静态隔离

所谓静态隔离是以服务隔离,是通过cgroups(LINUX control groups) 功能来支持的。比如HADOOP服务包含HDFS, HBASE, YARN等等,那么我们固定的设置比例,HDFS:20%, HBASE:40%, YARN:40%, 系统会帮我们根据整个集群的CPU,内存,IO数量来分割资源,先提一下,IO是无法分割的,所以只能说当遇到IO问题时根据比例由谁先拿到资源,CPU和内存是预先分配好的。

上面这种按照比例固定分割就是静态分割了,仔细想想,这种做法弊端太多,假设我按照一定的比例预先分割好了,但是如果我晚上主要跑mapreduce, 白天主要是HBASE工作,这种情况怎么办? 静态分割无法很好的支持,缺陷太大。

动态隔离

动态隔离只要是针对 YARN以及impala, 所谓动态只是相对静态来说,其实也不是动态。 先说YARN, 在HADOOP整个环境,主要服务有哪些? mapreduce(这里再提一下,mapreduce是应用,YARN是框架,搞清楚这个概念),HBASE, HIVE,SPARK,HDFS,IMPALA, 实际上主要的大概这些,很多人估计会表示不赞同,oozie, ES, storm , kylin,flink等等这些和YARN离的太远了,不依赖YARN的资源服务,而且这些服务都是单独部署就OK,关联性不大。 所以主要和YARN有关也就是HIVE, SPARK,Mapreduce。这几个服务也正式目前用的最多的(HBASE用的也很多,但是和YARN没啥关系)。

根据上面的描述,大家应该能理解为什么所谓的动态隔离主要是针对YARN。好了,既然YARN占的比重这么多,那么如果能很好的对YARN进行资源隔离,那也是不错的。如果我有3个部分都需要使用HADOOP,那么我希望能根据不同部门设置资源的优先级别,实际上也是根据比例来设置,建立3个queue name, 开发部们30%,数据分析部分50%,运营部门20%

设置了比例之后,再提交JOB的时候设置mapreduce.queue.name,那么JOB就会进入指定的队列里面。 非常可惜的是,如果你指定了一个不存在的队列,JOB仍然可以执行,这个是目前无解的,默认提交JOBYARN的时候,规则是root.users.username , 队列不存在,会自动以这种格式生成队列名称。 队列设置好之后,再通过ACL来控制谁能提交或者KIll job

隔离方式选择

从上面2种资源隔离来看,没有哪一种做的很好,如果非要选一种,我会选取后者,隔离YARN资源, 第一种固定分割服务的方式实在支持不了现在的业务

自定义队列

需求:现在一个集群当中,可能有多个用户都需要使用,例如开发人员需要提交任务,测试人员需要提交任务,以及其他部门工作同事也需要提交任务到集群上面去,对于我们多个用户同时提交任务,我们可以通过配置yarn的多用户资源隔离来进行实现

第一步:node01编辑yarn-site.xml

node01修改yarn-site.xml添加以下配置

cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop

vim yarn-site.xml
<!-- 指定我们的任务调度使用fairScheduler的调度方式 -->
<property>
  <name>yarn.resourcemanager.scheduler.class</name>
 <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>
<!-- 指定我们的任务调度的配置文件路径 -->
<property>
  <name>yarn.scheduler.fair.allocation.file</name>
  <value>/kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop/fair-scheduler.xml</value>
</property>
<!-- 是否启用资源抢占,如果启用,那么当该队列资源使用
yarn.scheduler.fair.preemption.cluster-utilization-threshold 这么多比例的时候,就从其他空闲队列抢占资源
 -->
<property>
  <name>yarn.scheduler.fair.preemption</name>
  <value>true</value>
</property>
<property>
  <name>yarn.scheduler.fair.preemption.cluster-utilization-threshold</name>
  <value>0.8f</value>
</property>
<!-- 默认提交到default队列 -->
<property>
  <name>yarn.scheduler.fair.user-as-default-queue</name>
  <value>true</value>
  <description>default is True</description>
</property>
<!-- 如果提交一个任务没有到任何的队列,是否允许创建一个新的队列,设置false不允许 -->
<property>
  <name>yarn.scheduler.fair.allow-undeclared-pools</name>
  <value>false</value>
  <description>default is True</description>
</property>

第二步:node01添加fair-scheduler.xml配置文件

node01执行以下命令,添加faie-scheduler.xml的配置文件

cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop

vim fair-scheduler.xml

复制下列内容到集群配置文件的时候,特别注意有没有全部复制了,之前就因为漏复制了一点内容,导致ResourceManager启动不了。

<?xml version="1.0"?>

<allocations>
<!-- users max running apps -->
<userMaxAppsDefault>30</userMaxAppsDefault>

<!-- 定义我们的队列 -->
<queue name="root">
  <minResources>512mb,4vcores</minResources>
  <maxResources>102400mb,100vcores</maxResources>
  <maxRunningApps>100</maxRunningApps>
  <weight>1.0</weight>
  <schedulingMode>fair</schedulingMode>
  <aclSubmitApps> </aclSubmitApps>
  <aclAdministerApps> </aclAdministerApps>
  <queue name="default">
    <minResources>512mb,4vcores</minResources>
    <maxResources>30720mb,30vcores</maxResources>
    <maxRunningApps>100</maxRunningApps>
    <schedulingMode>fair</schedulingMode>
    <weight>1.0</weight>
    <!-- 所有的任务如果不指定任务队列,都提交到default队列里面来 -->
    <aclSubmitApps>*</aclSubmitApps>
  </queue>
<!--
weight:资源池权重

aclSubmitApps:允许提交任务的用户名和组;
格式为: 用户名 用户组
当有多个用户时候,格式为:用户名1,用户名2 用户名1所属组,用户名2所属组

aclAdministerApps:允许管理任务的用户名和组;
格式同上。
 -->
  <queue name="hadoop">
    <minResources>512mb,4vcores</minResources>
    <maxResources>20480mb,20vcores</maxResources>
    <maxRunningApps>100</maxRunningApps>
    <schedulingMode>fair</schedulingMode>
    <weight>2.0</weight>
    <aclSubmitApps>hadoop hadoop</aclSubmitApps>
    <aclAdministerApps>hadoop hadoop</aclAdministerApps>
  </queue>
  <queue name="develop">
    <minResources>512mb,4vcores</minResources>
    <maxResources>20480mb,20vcores</maxResources>
    <maxRunningApps>100</maxRunningApps>
    <schedulingMode>fair</schedulingMode>
    <weight>1</weight>
    <aclSubmitApps>develop develop</aclSubmitApps>
    <aclAdministerApps>develop develop</aclAdministerApps>
  </queue>
  <queue name="test1">
    <minResources>512mb,4vcores</minResources>
    <maxResources>20480mb,20vcores</maxResources>
    <maxRunningApps>100</maxRunningApps>
    <schedulingMode>fair</schedulingMode>
    <weight>1.5</weight>
    <aclSubmitApps>test1,hadoop,develop test1</aclSubmitApps>
    <aclAdministerApps>test1 group_businessC,supergroup</aclAdministerApps>
  </queue>
</queue>
</allocations>

第三步:将修改后的配置文件拷贝到其他机器上

node01修改后的yarn-site.xmlfair-scheduler.xml配置文件分发到其他服务器上面去

cd /kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop

[root@node01 hadoop]# scp yarn-site.xml fair-scheduler.xml node02:$PWD

[root@node01 hadoop]# scp yarn-site.xml fair-scheduler.xml node03:$PWD

第四步:重启yarn集群

修改完yarn-site.xml配置文件之后,重启yarn集群,node01执行以下命令进行重启

[root@node01 hadoop]# cd /kkb/install/hadoop-2.6.0-cdh5.14.2/

[root@node01 hadoop-2.6.0-cdh5.14.2]# sbin/stop-yarn.sh
[root@node01 hadoop-2.6.0-cdh5.14.2]# sbin/start-yarn.sh

重新登陆node01:80088,可以看到,已经新增了几个队列。

image-20200216231805711

指定任务提交的队列

指定mapreduce任务的提交队列:

修改代码,添加我们mapreduce任务需要提交到哪一个队列里面去

//在组装类的run方法里添加以下内容:
Configuration configuration = new Configuration();
configuration.set("mapred.job.queue.name", "develop"); //第二个参数是要指定的队列名称

指定hive任务的提交队列:

hive-site.xml

<property>
  <name>mapreduce.job.queuename</name>
  <value>test1</value>
</property>

指定spark任务提交的队列

1- 脚本方式

--queue hadoop

2- 代码方式

saprkConf.set("yarn,spark.queue", "develop")

posted @ 2020-08-26 23:30  Whatever_It_Takes  阅读(1862)  评论(0编辑  收藏  举报