1.4、CDH 搭建Hadoop在安装之前(推荐的群集主机和角色分配)
推荐的群集主机和角色分配
使用Cloudera Manager安装向导安装CDH时,Cloudera Manager会尝试根据主机中可用的资源在群集主机(分配给网关主机的角色除外)之间分配角色。您可以在向导中显示的“ 自定义角色分配”页面上更改这些分配。您也可以稍后使用Cloudera Manager更改和添加角色。请参阅角色实例。
如果您的群集使用静态数据加密,请参阅为密钥受托者服务器和密钥受托者KMS分配主机。
有关在何处找到Cloudera Manager和其他服务所需的各种数据库的信息,请参阅步骤4:安装和配置数据库。
CDH群集主机和角色分配
- 主主机运行Hadoop主进程,例如HDFS NameNode和YARN Resource Manager。
- 实用程序主机运行不是主进程的其他集群进程,例如Cloudera Manager和Hive Metastore。
- 网关主机是用于在群集中启动作业的客户端访问点。所需的网关主机数量取决于工作负载的类型和大小。
- 工作者主机主要运行DataNode和其他分布式进程,例如Impalad。
重要提示: Cloudera建议您在生产环境中使用CDH时始终启用高可用性。
下表描述了针对不同群集大小的建议角色分配:
3 - 10 Worker Hosts without High Availability
| Master Hosts | Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
Master Host 1:
|
One host for all Utility and Gateway roles:
|
3 - 10 Worker Hosts:
|
|
3 - 20 Worker Hosts with High Availability
| Master Hosts | Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
|
Master Host 1:
Master Host 2:
Master Host 3:
|
Utility Host 1:
|
One or more Gateway Hosts:
|
3 - 20 Worker Hosts:
|
20 - 80 Worker Hosts with High Availability
| Master Hosts | Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
|
Master Host 1:
Master Host 2:
Master Host 3:
|
Utility Host 1:
Utility Host 2:
|
One or more Gateway Hosts:
|
20 - 80 Worker Hosts:
|
80 - 200 Worker Hosts with High Availability
| Master Hosts | Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
|
Master Host 1:
Master Host 2:
Master Host 3:
|
Utility Host 1:
Utility Host 2:
Utility Host 3:
Utility Host 4:
Utility Host 5:
Utility Host 6:
Utility Host 7:
Utility Host 8:
|
One or more Gateway Hosts:
|
80 - 200 Worker Hosts:
|
200 - 500 Worker Hosts with High Availability
| Master Hosts | Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
|
Master Host 1:
Master Host 2:
Master Host 3:
Master Host 4:
Master Host 5:
We recommend no more than three Kudu masters. |
Utility Host 1:
Utility Host 2:
Utility Host 3:
Utility Host 4:
Utility Host 5:
Utility Host 6:
Utility Host 7:
Utility Host 8:
|
One or more Gateway Hosts:
|
200 - 500 Worker Hosts:
|
500 -1000 Worker Hosts with High Availability
|
Master Hosts
|
Utility Hosts | Gateway Hosts | Worker Hosts |
|---|---|---|---|
|
Master Host 1:
Master Host 2:
Master Host 3:
Master Host 4:
Master Host 5:
We recommend no more than three Kudu masters. |
Utility Host 1:
Utility Host 2:
Utility Host 3:
Utility Host 4:
Utility Host 5:
Utility Host 6:
Utility Host 7:
Utility Host 8:
|
One or more Gateway Hosts:
|
500 - 1000 Worker Hosts:
|
为密钥受托者服务器和密钥受托者KMS分配主机
如果要为CDH群集启用静态数据加密,Cloudera建议您通过在Cloudera Manager管理的单独群集中的专用主机上部署密钥受托者服务器,将密钥受托者服务器与其他企业数据中心(EDH)服务隔离开来。Cloudera还建议在与需要访问Key Trustee Server的EDH服务相同的群集中的专用主机上部署Key Trustee KMS。此体系结构允许多个群集共享相同的密钥托管服务器,并避免在重新启动群集时重新启动密钥托管服务器。
对于一般的生产环境,或者如果您已启用HDFS的高可用性并且正在使用静态数据加密,Cloudera建议您为密钥受托服务器和密钥受托者KMS启用高可用性。
1.4、CDH 搭建Hadoop在安装之前(推荐的群集主机和角色分配)的更多相关文章
- 2.7、CDH 搭建Hadoop在安装(使用向导设置群集)
步骤7:使用向导设置群集 完成“ 群集安装”向导后,“ 群集设置”向导将自动启动.以下部分将指导您完成向导的每个页面: 选择服务 分配角色 设置数据库 查看更改 首次运行命令 恭喜! 选择服务 “ 选 ...
- 1、CDH 搭建Hadoop在安装之前(存储空间规划)
Cloudera Manager的存储空间规划 最低要求角色: 完全管理员 Cloudera Manager跟踪许多后台进程中的服务,作业和应用程序的度量标准.所有这些指标都需要存储.根据组织的大小, ...
- 2.2、CDH 搭建Hadoop在安装(安装Java Development Kit)
第2步:安装Java Development Kit 要安装Oracle JDK,您可以使用Cloudera Manager安装Cloudera提供的版本,也可以直接安装Oracle的其他版本. 继续 ...
- 1.5.7、CDH 搭建Hadoop在安装之前(定制安装解决方案---配置单用户模式)
配置单用户模式 在传统的Cloudera Manager部署中,管理每台主机上的Hadoop进程的Cloudera Manager Agent以root用户身份运行.但是,某些环境会限制对root帐户 ...
- 2.5、CDH 搭建Hadoop在安装(设置Cloudera Manager数据库)
步骤5:设置Cloudera Manager数据库 Cloudera Manager Server包含一个可以为自己创建和配置数据库的脚本.该脚本可以: 创建Cloudera Manager Serv ...
- 2.6、CDH 搭建Hadoop在安装(安装CDH和其他软件)
第6步:安装CDH和其他软件 设置Cloudera Manager数据库后,启动Cloudera Manager Server,然后登录Cloudera Manager Admin Console: ...
- 2.1、CDH 搭建Hadoop在安装(为Cloudera Manager配置存储库)
步骤1:为Cloudera Manager配置存储库 使用包管理工具安装Cloudera Manager yum 对于RHEL兼容系统, zypper对于SLES,和 apt-get对于Ubuntu. ...
- 1.5.6、CDH 搭建Hadoop在安装之前(定制安装解决方案---使用Cloudera Manager模板创建CDH群集)
使用Cloudera Manager模板创建CDH群集 您可以通过从Cloudera Manager管理的现有CDH群集导出群集模板来创建新的CDH群集.然后,您可以修改模板并使用它在新的主机集上创建 ...
- 1.5.3、CDH 搭建Hadoop在安装之前(定制安装解决方案---创建群集主机的虚拟映像)
创建群集主机的虚拟映像 您可以使用预先部署的Cloudera软件创建虚拟机映像,例如PXE启动映像,Amazon AMI和Azure VM映像,这些映像可用于快速启动虚拟机.这些图像使用parcel来 ...
随机推荐
- h5py库安装问题解决
H5py官网教程完全有问题,这个大家都这么说,但是貌似问题出现在Numpy上,由于numpy的版本过高! 这里是官网的教程:http://docs.h5py.org/en/latest/build.h ...
- WebForm多页面传值跳转
一.URL传值 URL传值是利用跳转地址直接加变量定义内容 格式:跳转地址?任意变量=传的值--?=之间不能有空格 多条数据传值 在地址栏继续拼接&key=value void Button1 ...
- django之urlresolver
>>> from django.utils.regex_helper import normalize >>> bits=normalize(r'^static/( ...
- Spring-data-jpa 常用的时间注解
@Entity //不写@Table默认为user @Table(name="t_user",schema="DB_name") //自定义表名 public ...
- NFS服务基本配置及使用
操作系统:redhat 7.2 参考链接:https://www.cnblogs.com/dscode/p/6146409.html NFS:Network File System 一.服务器端配置 ...
- VUE.js全局变量的定义
模块化之后,想用js全局变量,遇到点困难.搜索资料后搞定,大概2个步骤: 1.定义一个vue模块,const定义变量,并用export对外暴露. Globle.vue <script> / ...
- Android虚拟机与Java虚拟机 两种虚拟机的比较
在Android的体系框架中有一部分叫做Android Runtime,即Android运行时环境,这个环境包括了两个部分,一个是Android的核心类库,还有一个就是Dalvik虚拟机了. Andr ...
- SpringBoot配置发送邮件
一.导入jar包 <dependency> <groupId>org.springframework.boot</groupId> <artifactId&g ...
- pycharm 对数据库进行可视化操作
https://blog.csdn.net/qq_24189933/article/details/75666243
- js 迭代 方法
在js 中,有一些方法, 可以很方便的遍历出数据,不用进行for循环就可以,是怎么实现的呢? 例如:在javascript 中的forEach 方法:打印一个数组的索引和项目: 1. forEach ...