Cloudera Certified Associate Administrator案例之Install篇

　　　　　Cloudera Certified Associate Administrator案例之Install篇

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

一.创建主机模板（为了给主机套用，说白了就是给新加入集群的节点提前分配好角色）

问题描述：

　　公司新购了一批机器，准备扩充DataNode节点。你决定用CM的host template功能来为新机器配置DataNode通用的服务。新节点需要作为HDFS和YARN的工作节点，因此模板的设计如下：

　　　　名称：Temp1

　　　　HDFS roles：Datanode

　　　　YARN roles：NodeManager

   要求需要套用HDFS和YARN的Default Group的配置

解决方案：
　　在企业级实战中，集群扩容时常见且重要的操作，如果手工一台一台操作，不仅效率地下，而且容易出错。
　　CM提供了多种机制来简化扩容操作，其中host template就是其中重要的一种，通过该特性，可以大大简化工作节点的配置（对于管理节点，工具节点，边缘节点，如果有多台配置完全一样，也可以使用该特性来扩容），如Datanode，Nodemanager，Kafka Broker等。

1>.点击主机，选择"主机模板"

2>.点击创建

3>.自定义模板名称并选择对应的角色和组

4>.创建成功

二.创建角色组

问题描述：

　　公司新购了一批机器，准备扩充DataNode节点。然而，新机器的硬件配置和旧机器有一些差异。你决定为旧机器创建一个角色组，设置合适的配置。新机器继续使用默认的组（Default Group）的配置，就如前面我们配置的模板一样。新角色组的需求为：
　　　　命名为DN1,先继承默认的角色组的配置，并使用旧机器套用DN1的配置。然后要变更一些参数，DN1的Default Group的DataNode Volume Choosing Policy参数都必须设置为Avaliable Space。
　　　　Default Group的Available Space Policy Balanced Preference参数需要设置为0.85，DN1的Available Space Policy Balanced Preference参数设置为0.8。

解决方案：
　　异构集群是Hadoop运维中比较棘手的一个问题，因此我们推荐大家在新建集群时尽量使用相同的硬件（工作节点）以避免各种麻烦。但现实中由于企业规划不佳，采购限制等诸多原因，很可能出现异构的情况，因此我们需要具备一定的应对能力。

1>.使用正确的用户名密码登录CM界面,点击hdfs服务

2>.进入HDFS服务管理界面后，点击"配置"，再点击"角色组"

3>.点击"创建"按钮来创建一个自定义的角色组

4>.编辑角色组信息

5>.查看Datanode默认组的节点信息

6>.如下图所示，点击“移至另一个角色组”

7>.点击"移动"

8>.默认角色组已经移动到咱们刚刚新建的dn1角色组，但需要重启才能生效，我们不着急重启，继续看下一步操作。

9>.搜索关键字"DataNode Volume Choosing Policy"

10>.搜索关键字“Available Space Policy Balanced Preference”

11>.做完上述操作后，我们需要重启HDFS集群，使得配置生效

三.将新节点加入集群

问题描述：

    正式地将新节点加入集群。我们需要将node107.yinzhengjie.org.cn这个节点加入CM的托管，并套用Temp1这个主机模板从而加入集群。

解决方案：

　　在实践中集群扩容，损坏硬件更换时都设计到这个操作，因此也要熟练掌握。

我们假设将要加入集群的主机已经配置好环境并启动Cloudera Manager Agent进程，详情请参考：https://www.cnblogs.com/yinzhengjie/articles/11019525.html

1>.点击“所有主机”

2>.点击"向集群添加新主机"

3>.进入"添加主机向导"

4>.为CDH集群安装指定主机

5>.等待主机激活完毕后，点击"继续"

6>.点击继续

7>. 选择咱们之前创建的主机模板（您选中的模板有对应的角色，而新加入的节点将来就会继承该主机模板的角色）

8>.等待集群重启完毕

9>.主机扩展成功（需要注意的是，如果在第7步骤没有选择对应的主机模板也没事，只要agent成功加入集群后，我们选中相应的节点并点击下图的"已选定操作"，选择"应用主机模板"选项就有对应的你之前创建的模板供你选择，选择主机模板后别忘记顺便勾选"应用主机模板后部署客户端配置并启动新创建的角色。"属性）

四.移除CDH集群的节点

1>.点击"主机"，选择"所有主机"

2>.勾选需要下线的主机

3>.我们点击"已选定的操作"（英文为"Actions for Selected "），选择"Begin Maintenance"(表示进入维护模式，进入维护模式会听到该主机的服务)

4>.点击"Begin Maintenance"

5>.主机进行授权命令

6>.主机进入维护模式，我们需要手动停掉agent进程

7>.选择从集群中删除

8>.点击确认

9>.删除主机上的角色（等待时间较长）

10>.角色移除成功

11>.点击"Remove From Cloudera Manager"

12>.点击"确认"

13>.节点移除成功

14>.对于 CM Manager 来说，它会把主机元数据全部存放在数据库里，对应的表为"${DATABASE}.HOSTS"（如果你不想从Cloudera Manager WebUI来删除，那咱们就可以考虑直接去数据库干掉他！但是相对来说比较危险，万一你不小心删除错主机就比较尴尬啦~）

mysql> SELECT * FROM HOSTS\G

*************************** 1. row ***************************

                HOST_ID: 2

OPTIMISTIC_LOCK_VERSION: 14

        HOST_IDENTIFIER: 5411b2de-f7e8-45de-bde3-6d8aedfed4d5

                   NAME: node101.yinzhengjie.org.cn

             IP_ADDRESS: 172.30.1.101

                RACK_ID: /default

                 STATUS: NA

    CONFIG_CONTAINER_ID: 1

      MAINTENANCE_COUNT: 0

     DECOMMISSION_COUNT: 0

             CLUSTER_ID: 1

              NUM_CORES: 4

   TOTAL_PHYS_MEM_BYTES: 8182054912

            PUBLIC_NAME: NULL

      PUBLIC_IP_ADDRESS: NULL

         CLOUD_PROVIDER: NULL

*************************** 2. row ***************************

                HOST_ID: 3

OPTIMISTIC_LOCK_VERSION: 13

        HOST_IDENTIFIER: 0a4853a0-7adc-4dae-a1da-3a12636f3574

                   NAME: node103.yinzhengjie.org.cn

             IP_ADDRESS: 172.30.1.103

                RACK_ID: /default

                 STATUS: NA

    CONFIG_CONTAINER_ID: 1

      MAINTENANCE_COUNT: 0

     DECOMMISSION_COUNT: 0

             CLUSTER_ID: 1

              NUM_CORES: 4

   TOTAL_PHYS_MEM_BYTES: 3954196480

            PUBLIC_NAME: NULL

      PUBLIC_IP_ADDRESS: NULL

         CLOUD_PROVIDER: NULL

*************************** 3. row ***************************

                HOST_ID: 4

OPTIMISTIC_LOCK_VERSION: 13

        HOST_IDENTIFIER: b613ff6e-6890-447a-a161-7f5324a14143

                   NAME: node102.yinzhengjie.org.cn

             IP_ADDRESS: 172.30.1.102

                RACK_ID: /default

                 STATUS: NA

    CONFIG_CONTAINER_ID: 1

      MAINTENANCE_COUNT: 0

     DECOMMISSION_COUNT: 0

             CLUSTER_ID: 1

              NUM_CORES: 4

   TOTAL_PHYS_MEM_BYTES: 3954196480

            PUBLIC_NAME: NULL

      PUBLIC_IP_ADDRESS: NULL

         CLOUD_PROVIDER: NULL

*************************** 4. row ***************************

                HOST_ID: 5

OPTIMISTIC_LOCK_VERSION: 13

        HOST_IDENTIFIER: f58247ff-4d3f-40d3-8f49-8f91f45d4407

                   NAME: node104.yinzhengjie.org.cn

             IP_ADDRESS: 172.30.1.104

                RACK_ID: /default

                 STATUS: NA

    CONFIG_CONTAINER_ID: 1

      MAINTENANCE_COUNT: 0

     DECOMMISSION_COUNT: 0

             CLUSTER_ID: 1

              NUM_CORES: 4

   TOTAL_PHYS_MEM_BYTES: 3954196480

            PUBLIC_NAME: NULL

      PUBLIC_IP_ADDRESS: NULL

         CLOUD_PROVIDER: NULL

4 rows in set (0.00 sec)

mysql>

mysql> SELECT * FROM HOSTS\G

五.

Cloudera Certified Associate Administrator案例之Install篇的更多相关文章

Cloudera Certified Associate Administrator案例之Troubleshoot篇
Cloudera Certified Associate Administrator案例之Troubleshoot篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.调整日志的进 ...
Cloudera Certified Associate Administrator案例之Test篇
Cloudera Certified Associate Administrator案例之Test篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.准备工作(将CM升级到&qu ...
Cloudera Certified Associate Administrator案例之Manage篇
Cloudera Certified Associate Administrator案例之Manage篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载Namenode镜像 ...
Cloudera Certified Associate Administrator案例之Configure篇
Cloudera Certified Associate Administrator案例之Configure篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载CDH集群中最 ...
Flume实战案例运维篇
Flume实战案例运维篇作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Flume概述 1>.什么是Flume Flume是一个分布式.可靠.高可用的海量日志聚合系统,支 ...
CNCF基金会的Certified Kubernetes Administrator认证考试计划
关于CKA考试 CKA(Certified Kubernetes Administrator)是CNCF基金会(Cloud Native Computing Foundation)官方推出的Kuber ...
分享数百个 HT 工业互联网 2D 3D 可视化应用案例之 2019 篇
继<分享数百个 HT 工业互联网 2D 3D 可视化应用案例>2018 篇,图扑软件定义 2018 为国内工业互联网可视化的元年后,2019 年里我们与各行业客户进行了更深度合作,拓展了H ...
数百个 HT 工业互联网 2D 3D 可视化应用案例分享 - 2019 篇
继<分享数百个 HT 工业互联网 2D 3D 可视化应用案例>2018 篇,图扑软件定义 2018 为国内工业互联网可视化的元年后,2019 年里我们与各行业客户进行了更深度合作,拓展了H ...
robotframework+selenium搭配chrome浏览器，web测试案例（搭建篇）
这两天发布版本做的事情有点多,都没有时间努力学习了,先给自己个差评,今天折腾了一天, 把robotframework 和 selenium 还有appnium 都研究了一下 ,大概有个谱,先说说we ...

随机推荐

[数据结构 - 第6章] 树之二叉排序树（C语言实现）
一.什么是二叉排序树? 对于普通的顺序存储来说,插入.删除操作很简便,效率高:而这样的表由于无序造成查找的效率很低. 对于有序线性表来说(顺序存储的),查找可用折半.插值.斐波那契等查找算法实现,效率 ...
使用Python的turtle画小绵羊
今天学习使用turtle画图,本来想实现个3D效果,结果2D都画了半天,画圆被绕晕了目标图片: 实现代码: # -*- coding:utf-8 -*- # __author__ :kusy # _ ...
手撕面试官系列(三)：微服务架构Dubbo+Spring Boot+Spring Cloud
文章首发于今日头条:https://www.toutiao.com/i6712696637623370248/ 直接进入主题 Dubbo (答案领取方式见侧边栏) Dubbo 中中 zookeepe ...
php开发工程师都需要掌握什么技能呢？
PHP原生标准库精通,三种大型框架中熟练掌握一门的开发(Symfony2.Yii.ZF2),小型框架中(Codeigniter 等)通读其一源码. MySQL语句精通,实践构造 1000 万级的数据库 ...
day18——re正则表达式
day18 re模块--正则表达式匹配方法 findall():从字符串中全部查找内容,返回一个列表 s = "meet_宝元_meet" print(re.findall(&q ...
一句话比较两种算法的优越性[蓝桥杯，LeetCode]
动态规划 166 数学 155 字符串 146 树 120 哈希表 119 深度优先搜索 109 二分查找 79 贪心算法 64 双指针 59 广度优先搜索 54 栈 53 回溯算法 49 设计 41 ...
学java必须知道的那些queue
队列是我们学java必须接触到的知识,很多内容都和它相关,但是你真的了解它们的概念和使用方法吗?在本文,你可以获取关于queue的一切信息,希望我能够帮助你在java的学习道路上乘风破浪. 概念队列 ...
HSF 开发
HSF 简介 HSF(High Speed Service Framework),高速服务框架,是阿里-主要采用的服务框架,其目的是作为桥梁联通不同的业务系统,解耦系统之间的实现依赖. 1: RPC ...
（五）pdf的构成之文件体（catalog对象）
引自:https://blog.csdn.net/steve_cui/article/details/82735039 目录(catalog): 文档目录包含对定义文档内容的其他对象的引用.它还包含声 ...
【题解】Luogu P5283 [十二省联考2019]异或粽子
原题传送门看见一段的异或和不难想到要做异或前缀和$s$ 我们便将问题转化成:给定$n$个数,求异或值最靠前的$k$对之和我们珂以建一个可持久化01trie,这样我们就珂以求出每个值\( ...

Cloudera Certified Associate Administrator案例之Install篇

Cloudera Certified Associate Administrator案例之Install篇的更多相关文章

随机推荐

热门专题