Capacity 调度器配置

<property>
<name>yarn.resourcemanager.scheduler.class<name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>

加载配置文件

$yarn rmadmin -refreshQueues

Root --- QueueA --- A1,  A2
          |-- QueueB --- B1,  B2
          |-- QueueC --- C1,  C2

队列

<property>
<name>yarn.scheduler.capacity.root.queues<name>
<value>QueueA, QueueB, QueueC</value>
</property> <property>
<name>yarn.scheduler.capacity.QueueA.queues<name>
<value>A1, A2</value>
</property>

队列访问权限控制

<property>
<name>yarn.scheduler.capacity.root.QueueA.acl_submit_applications<name>
<value>u1, u2 g1</value>
<description>限定哪些Linux用户/用户组可向给定队列中提交应用程序</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.acl_administer_queue<name>
<value>g1</value>
<description>为队列指定一个管理员,该管理员可控制该队列的所有应用程序,比如杀死任意一个应用程序等</description>
</property>

层级队列Capacity管理

<property>
<name>yarn.scheduler.capacity.root.QueueA.capacity<name>
<value>60</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueB.capacity<name>
<value>10</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueC.capacity<name>
<value>30</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A1.capacity<name>
<value>20</value>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.A2.capacity<name>
<value>80</value>
</property>

队列A1不能超过父队列queueA的40%的资源。

<property>
<name>yarn.scheduler.capacity.root.QueueA.A1.maximum-capacity<name>
<value>40</value>
</property>

队列的状态

<property>
<name>yarn.scheduler.capacity.root.QueueB.state<name>
<value>RUNNING</value>
</property>

应用程序限制

<property>
<name>yarn.scheduler.capacity.maximum-applications<name>
<value>10000</value>
<description>集群同时运行的最大作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-applications<name>
<value>10000</value>
<description>队列root.QueueA同时运行的最大作业数</description>
</property>
<property>
<name>yarn.scheduler.capacity.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制同时运行的作业数</description>
</property> <property>
<name>yarn.scheduler.capacity.root.QueueA.maximum-am-resource-percent<name>
<value>0.1</value>
<description>AM所占资源最大比例,用来控制队列root.QueueA同时运行的作业数</description>
</property>

Hadoop Yarn Capacity Scheduler的更多相关文章

  1. <Yarn> <Capacity Scheduler> <Source Code>

    Yarn capacity scheduler 首先要知道, [Attention: RM有两个组件,其中Scheduler完全就只是负责资源的分配:ApplicationsManager则负责接受a ...

  2. 利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制

    转自:https://m.aliyun.com/yunqi/articles/79700 背景 使用过hadoop的人基本都会考虑集群里面资源的调度和优先级的问题,假设你现在所在的公司有一个大hado ...

  3. YARN资源调度策略之Capacity Scheduler

    背景 yarn默认使用的是最简单的FIFO调度器,即一个default队列,所有用户共享,分配资源也是先到先得,没有优先级之分.有时一两个任务就把资源全占了,其他任务吃不到资源造成饥饿,显然这样的资源 ...

  4. Hadoop YARN 调度器(scheduler) —— 资源调度策略

    本文通过MetaWeblog自动发布,原文及更新链接:https://extendswind.top/posts/technical/hadoop_yarn_resource_scheduler 搜了 ...

  5. Hadoop Capacity Scheduler源码实现剖析

    作者: 大圆那些事 | 文章可以转载,请以超链接形式标明文章原始出处和作者信息 网址: http://www.cnblogs.com/panfeng412/archive/2013/09/13/had ...

  6. YARN的Fair Scheduler和Capacity Scheduler

    关于Scheduler YARN有四种调度机制:Fair Schedule,Capacity Schedule,FIFO以及Priority: 其中Fair Scheduler是资源池机制,进入到里面 ...

  7. Hadoop的三种调度器FIFO、Capacity Scheduler、Fair Scheduler(转载)

    目前Hadoop有三种比较流行的资源调度器:FIFO .Capacity Scheduler.Fair Scheduler.目前Hadoop2.7默认使用的是Capacity Scheduler容量调 ...

  8. 大数据之Yarn——Capacity调度器概念以及配置

    试想一下,你现在所在的公司有一个hadoop的集群.但是A项目组经常做一些定时的BI报表,B项目组则经常使用一些软件做一些临时需求.那么他们肯定会遇到同时提交任务的场景,这个时候到底如何分配资源满足这 ...

  9. Hadoop YARN 100-1知识点

    0 YARN中实体 资源管理者(resource manager, RM) 长时间运行的守护进程,负责管理集群上资源的使用 节点管理者(node manager, NM) 长时间运行的守护进程,在集群 ...

随机推荐

  1. 《DSP using MATLAB》示例Example 8.4

    代码: %% ------------------------------------------------------------------------ %% Output Info about ...

  2. 《selenium2 python 自动化测试实战》(17)——几个cookies操作

    之前我们已经学过利用cookies跳过验证码登录了,那时候我们用的方法是add_cookie()方法,这里再给大家介绍两个,一般情况下我们用不到,了解一下就可以,而且如果真的用到的时候百度也很快的: ...

  3. 关于浏览器和IIS基础的简单理解

    浏览器 输入域名或者IP地址,按回车访问后:发生了什么??IIS是如何工作的?为什么能这么工作?? 1    浏览器和IIS 分别是两个应用程序:浏览器访问网址实际就是  两个应用程序的数据交互往来: ...

  4. Linux下gdb线程的调试

    多线程的调试命令 1.info threads: 这条命令显示的是当前可调试的所有线程,GDB会给每一个线程都分配一个ID.前面有*的线程是当前正在调试的线程. 2.thread ID: 切换到当前调 ...

  5. 关于SQL的几道小题详解

    关于SQL的几道小题详解 当我们拿到题目的时候,并不是急于作答,那样会得不偿失的,而是分析思路,采用什么方法,达到什么目的,还要思考有没有简单的方法或者通用的方法等等,这样才会达到以一当十的效果,这样 ...

  6. Centos用yum升级mysql到(5.5.37) (转)

    http://www.cnblogs.com/ikodota/p/use_yum_update_mysql.html 1. Change root user su - ## OR ## sudo -i ...

  7. 【备忘】mysql主从设置

    主(master)192.168.1.10机器设置: [root@vm-vagrant mysql]# vi my.cnf [mysqld]节点下添加以下配置server-id=1log-bin=my ...

  8. 类的声明与实例化及构造方法析构方法(PHP学习)

    <?php class human{ public static $leg=2; public $name = 'leo'; public $age = '25'; public functio ...

  9. C#String地址、拼接性能学习

    String类型不可变.定义string变量时会在堆上分配存储空间,而对该变量进行值变更时会重新分配一个存储空间,且保留原存储空间. 测试思路:获取string类型变量值变更前后的存储空间地址,判断地 ...

  10. 初学FPGA一些建议

    数字电路: 这是大学里的基本课程 ,涵盖了一般数字电路的组合电路.时序电路.寄存器传输.储存器以及可编程逻辑电路(FPGA 就是其中一种),还有比较好的添加了计算机的指令集结构.处理器设计等计算机方面 ...