hadoop中如何动态更新集群队列和容量

1.集群默认是FIFO容量调度器,有的时候不同的业务部门都需要使用hadoop集群,那么这时候就需要来设置容量调度器了,如何平衡各个部门的容量.合理利用资源?

首先配置调度器需要在修改两个配置文件,分别是mapred-site.xml.里面主要有两个参数,其中第二个mapred.queue.names就是用来添加业务部门,比如有hive hbase等就添加进去,用逗号隔开

<name>mapred.jobtracker.taskScheduler</name>

  <value>org.apache.hadoop.mapred.CapacityTaskScheduler</value>

</property>

<property>

  <name>mapred.queue.names</name>

  <value>default</value>

</property>

其次capacity-scheduler.xml文件中添加对应的配置和权限

属性mapred.capacity-scheduler.queue.hive.capacity的value决定了队列的容量比值

<property>

    <name>mapred.capacity-scheduler.queue.hive.capacity</name>

    <value>40</value>

    <description>Percentage of the number of slots in the cluster that are

      to be available for jobs in this queue.

    </description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.maximum-capacity</name>

    <value>-1</value>

    <description>

    </description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.supports-priority</name>

    <value>true</value>

    <description></description>

  </property>

    <property>

    <name>mapred.capacity-scheduler.queue.hive.minimum-user-limit-percent</name>

    <value>100</value>

    <description> </description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.user-limit-factor</name>

    <value>3</value>

    <description></description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.maximum-initialized-active-tasks</name>

    <value>200000</value>

    <description></description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.maximum-initialized-active-tasks-per-user</name>

    <value>100000</value>

    <description></description>

  </property>

  <property>

    <name>mapred.capacity-scheduler.queue.hive.init-accept-jobs-factor</name>

    <value>10</value>

    <description></description>

  </property>

那么如何动态的更新集群的动态和容量呢?

1.主节点修改好mapred-site.xml和capacity-scheduler.xml

2.把配置同步到所有节点上

3.使用hadoop用户执行命令:hadoop mradmin -refreshQueues

这样就可以不重启并且动态修改集群的队列及其容量配置.刷新mapreduce的web管理控制台可以看到结果。

注意:如果配置没有同步到所有的节点，一些队列会无法启用。

hadoop中如何动态更新集群队列和容量的更多相关文章

ElasticSearch如何更新集群的状态
ElasticSearch如何更新集群的状态最近发生了很多事情,甚至对自己的技术能力和学习方式产生了怀疑,所以有一段时间没更新文章了,估计以后更新的频率会越来越少,希望有更多的沉淀而不是简单地分享. ...
hadoop中的一次集群任务执行超时问题查找过程
问题背景本次进行一个项目的重构,在某些活动数据量比较大的情况下,会偶尔出现1200s超时的情况,如下: AttemptID:attempt_1410771599055_11709_m_000033_ ...
rancher更新集群证书
进入rancher 等待更新完成查看证书到期时间 >>>在rancher容器内部执行查看集群证书信息 for i in ls /var/lib/rancher/k3s/server ...
Hadoop中正确地添加和移除节点
正确地添加和移除节点添加节点克隆克隆一台全新的Linux(如有IP冲突,可右击VMware右下角网络图标断开连接) 打开/etc/hostname修改主机名打开/etc/sysconfig/n ...
Hadoop中客户端和服务器端的方法调用过程
1.Java动态代理实例 Java 动态代理一个简单的demo:(用以对比Hadoop中的动态代理) Hello接口: public interface Hello { void sayHello(S ...
Hadoop学习笔记—13.分布式集群中节点的动态添加与下架
开篇:在本笔记系列的第一篇中,我们介绍了如何搭建伪分布与分布模式的Hadoop集群.现在,我们来了解一下在一个Hadoop分布式集群中,如何动态(不关机且正在运行的情况下)地添加一个Hadoop节点与 ...
Apache Hadoop 2.9.2 的集群管理之服役和退役
Apache Hadoop 2.9.2 的集群管理之服役和退役作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 随着公司业务的发展,客户量越来越多,产生的日志自然也就越来越大来,可能 ...
浅析 Hadoop 中的数据倾斜
转自:http://my.oschina.net/leejun2005/blog/100922 最近几次被问到关于数据倾斜的问题,这里找了些资料也结合一些自己的理解. 在并行计算中我们总希望分配的每一 ...
Hadoop 系列（二）—— 集群资源管理器 YARN
一.hadoop yarn 简介 Apache YARN (Yet Another Resource Negotiator) 是 hadoop 2.0 引入的集群资源管理系统.用户可以将各种服务框架部 ...

随机推荐

Redis学习二：Redis高并发之主从模式
申明本文章首发自本人公众号:壹枝花算不算浪漫,如若转载请标明来源! 感兴趣的小伙伴可关注个人公众号:壹枝花算不算浪漫 22.jpg 前言前面已经学习了Redis的持久化方式,接下来开始学习Redi ...
Serval and Parenthesis Sequence CodeForces - 1153C
题目大意:一个字符串只含有? ( ),?可以变成 ) 或者 ( ,将字符串中所有的?变成) 或者 ( 使得字符串合法. 合法就是让括号配对,并且不可以提前结束比如:()()这样是不合法的. 题解:既然 ...
详解 File类
在讲解File类之前,本人先要讲解下路径,因为我们对于文件的操作是离不开路径的: 目录路径: File类文件名称过滤器: 路径: 请观看本人博文 -- <详解绝对路径与相对路径> ...
关于MIME类型问题，浏览器请求到的资源是乱码
简介我想很多同学都可能会遇到这样的问题,调用后台提共的静态资源服务api时,用浏览器打开发现却是一堆乱码.需要的是 JSON, 拿到的却是 xml,访问一个mp4的文件,浏览器直接下载.这一切的来源 ...
ES6中对数组的扩展
hello,大家好,我又来了. 前面讲了字符串和数值的扩展,今天要讲的是:数组的扩展.不知道大家能否跟得上这个节奏,你们在阅读中对讲解有存在疑惑,记得留言提出来,要真正地理解,否则白白 ...
Java同步方法：synchronized到底锁住了谁？
目录前言同步方法类的成员方法类的静态方法同步代码块总结其他同步方法参考资料前言相信不少同学在上完Java课后,对于线程同步部分的实战,都会感到不知其然. 比如上课做实验的时候,按着 ...
Linux 高 wio 分析
High IO wait Table of Contents 1. 现象 2. 分析 2.1. iotop或者pidstat 2.1.1. iotop 2.1.2. pidstat 2.2. 脚本 2 ...
UML由浅入深
在UML 2.0的13种图形中,类图是使用频率最高的UML图之一.Martin Fowler在其著作<UML Distilled: A Brief Guide to the Standard O ...
SQLI-LABS学习笔记(二)
逼话少说,如有错误,烦请指出,谢谢这两天生病,效率很低第5关打开页面发现跟前几题不同,没有直接返回数据.. 加个单引号 You have an error in your SQL syntax ...
Python2 和 Python3的区别
Python2 和 Python3的区别: 1.python2的默认编码方式是ascii码:python3的默认编码是utf-8. 如果出现乱码或者编码错误,可以使用以下编码在文件头来指定编码: #- ...

hadoop中如何动态更新集群队列和容量

hadoop中如何动态更新集群队列和容量的更多相关文章

随机推荐

热门专题