Cloudera Enterprise 6.2.x   或者参考https://blog.csdn.net/shawnhu007/article/details/52579204

第零步:优化相关

echo 'vm.swappiness = 10' >> /etc/sysctl.conf
sysctl -p ## 禁用透明大页面压缩
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled

第一步:配置网络名称

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/configure_network_names.html#configure_network_names

CDH 支持 IPv4,不支持 IPv6

1.设置唯一的主机名

hostnamectl set-hostname foo-1.example.com

2.编辑 /etc/hosts

每个主机名的规范名称必须是 FQDN(例如:myhost-1.example.com),而不应该是不合格的主机名(例如:myhost-1)

不要在 /etc/hosts 或 DNS 服务器中使用别名

非限定主机名(短名称)在 Cloudera Manager 实例中必须是唯一的。例如,您不能同时拥有 test.baidu.com 和 test.163.com

vim /etc/hosts
1.1.1.1 foo-1.example.com foo-1
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3
4.4.4.4 foo-4.example.com foo-4

3.编辑 /etc/sysconfig/network 为此主机的 FQDN

sed -i '/HOSTNAME/d' /etc/sysconfig/network
echo "HOSTNAME=`hostname`" >> /etc/sysconfig/network
cat /etc/sysconfig/network

4.验证设置

## a.使用 uname -a 命令查看是否有输出匹配的主机名
## b.运行 /sbin/ifconfig 命令,请注意 inet addr 在 eth0 or bond0 中的地址
## c.运行 host -v -t A $(hostname) 命令输出内容是否匹配主机名,IP地址部分应该跟 ifconfig 所报告的相匹配

第二步:禁用防火墙和 SELinux

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/install_cdh_disable_iptables.html

setenforce 0
sed -i -r "/^SELINUX=/c SELINUX=disabled" /etc/selinux/config
which systemctl && systemctl stop firewalld
which systemctl && systemctl disable firewalld
which systemctl && systemctl stop iptables || service iptables stop
which systemctl && systemctl disable iptables || chkconfig iptables off

第三步:启用 NTP 服务

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/install_cdh_enable_ntp.html

CDH 要求集群中的每台计算机都配置 NTP 服务,REHL7兼容操作系统默认使用 chronyd 而不是 NTPD

如果你系统上有同时安装 NTPD 和 chronyd,Cloudera Manager依赖 chronyd验证时间同步,即使它没有正确同步

1.安装chrony并配置(时间同步客户端)

yum install -y chrony

# 修改前备份chrony.conf
/bin/grep 666666 /etc/chrony.conf && /bin/cp /etc/chrony.conf.666666 /etc/chrony.conf || /bin/cp /etc/chrony.conf /etc/chrony.conf.666666
# 删除默认Server
sed -i "/server/d" /etc/chrony.conf
sed -i "/makestep/d" /etc/chrony.conf
# 新增阿里云服务器
echo "server ntp.aliyun.com iburst" >>/etc/chrony.conf
echo "makestep 1.0 -1" >>/etc/chrony.conf

2.重启服务并查看状态是否正常并设置开机自动启动

systemctl enable chronyd
systemctl restart chronyd
systemctl status chronyd
chronyc tracking

3.常用命令:

# 查看时间同步源:
chronyc sources -v # 查看时间同步源状态:
chronyc sourcestats -v # 启用NTP时间同步:
timedatectl set-ntp yes # 校准时间服务器:
chronyc tracking # 强制同步下系统时钟
chronyc -a makestep

第四步:安装 Python2.7

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/install_python_27.html

CDH6中的 Hue 需要 Python2.7,默认情况下他已经包含在 REHL7

兼容 REHL6的操作系统默认包含 Python2.6,在安装或升级到 Cloudera Enterprise 6 之前,必须在所有 Hue 主机上安装 Python2.7

第五步:配置本地 YUM 库

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/cm_ig_create_local_package_repo.html

1.设置 Web 服务器

yum install -y httpd
systemctl enable httpd
systemctl stop httpd
systemctl start httpd
systemctl status httpd

2.下载并发布包存储库

## Cloudera Manager 6
mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cm6/6.2.0/redhat7/ -P /var/www/html/cloudera-repos
wget https://archive.cloudera.com/cm6/6.2.0/allkeys.asc -P /var/www/html/cloudera-repos/cm6/6.2.0/ ## CDH 6
mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cdh6/6.2.0/redhat7/ -P /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/gplextras6/6.2.0/redhat7/ -P /var/www/html/cloudera-repos chmod -R ugo+rX /var/www/html/cloudera-repos/cdh6
chmod -R ugo+rX /var/www/html/cloudera-repos/gplextras6

3.配置主机以使用内部存储库

cat <<\EOF >/etc/yum.repos.d/cloudera-repo.repo
[cloudera-repo]
name=cloudera-repo
baseurl=http://192.168.100.66/cloudera-repos/cm6/6.2.0/redhat7/yum
enabled=1
gpgcheck=0
EOF

第六步:配置本地 Parel 存储库

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/cm_ig_create_local_parcel_repo.html

1.设置 Web 服务器

1.安装 httpd

yum install -y httpd

2.编辑 Apache HTTP Server配置文件

当尝试从本地存储库下载包时,跳过此步骤可能会导致哈希验证失败的错误,尤其在 Cloudera Manager 6 及更高的版本中

## 在 IfModule mime_module 部分添加以下行
cp /etc/httpd/conf/httpd.conf /etc/httpd/conf/httpd.conf.bak
vim /etc/httpd/conf/httpd.conf AddType application/x-gzip .gz .tgz .parcel

2.启动 Start Apache HTTP Server

systemctl enable httpd
systemctl stop httpd
systemctl start httpd
systemctl status httpd

3.下载和发布 Parcel 仓库

1.下载 CDH6

## Apache Impala, Apache Kudu, Apache Spark 2, and Cloudera Search 包含在 CDH parcel
mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/cdh6/6.2.0/parcels/ -P /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/gplextras6/6.2.0/parcels/ -P /var/www/html/cloudera-repos
chmod -R ugo+rX /var/www/html/cloudera-repos/cdh6
chmod -R ugo+rX /var/www/html/cloudera-repos/gplextras6

2.下载 Apache Accumulo for CDH

mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/accumulo-c5/parcels/1.7.2/ -P /var/www/html/cloudera-repos
chmod -R ugo+rX /var/www/html/cloudera-repos/accumulo-c5

3.下载 CDS Powered By Apache Spark 2 for CDH

mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories https://archive.cloudera.com/spark2/parcels/2.3.0.cloudera3/ -P /var/www/html/cloudera-repos
chmod -R ugo+rX /var/www/html/cloudera-repos/spark2

4.下载 Cloudera Navigator Key Trustee Server

5.下载 Cloudera Navigator Key Trustee KMS and HSM KMS

6.Sqoop Connectors

mkdir -p /var/www/html/cloudera-repos
wget --recursive --no-parent --no-host-directories http://archive.cloudera.com/sqoop-connectors/parcels/latest/ -P /var/www/html/cloudera-repos
chmod -R ugo+rX /var/www/html/cloudera-repos/sqoop-connectors

7.验证已下载文件是否存在

访问以下地址,验证您下载的文件是否存在
http://192.168.100.66/cloudera-repos

4.使用本地 Parcel 仓库

1.打开 Cloudera Manager Admin Console 并导航到 Parcels 页面

2.选在“”

Cloudera Enterprise 6.2.x

第一步:配置存储库

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/configure_cm_repo.html#cm_repo

方法1:使用官方 YUM 库

## 下载 repo 文件
wget https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/cloudera-manager.repo -P /etc/yum.repos.d/ ## 导入 GPG 密钥
rpm --import https://archive.cloudera.com/cm6/6.2.0/redhat7/yum/RPM-GPG-KEY-cloudera

方法2:使用上一步建议的本地 YUM 仓库

cat <<\EOF >/etc/yum.repos.d/cloudera-repo.repo
[cloudera-repo]
name=cloudera-repo
baseurl=http://192.168.100.66/cloudera-repos/cm6/6.2.0/redhat7/yum
enabled=1
gpgcheck=0
EOF

第二步:安装 JDK 环境

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/cdh_ig_jdk_installation.html

- 要求:

JDK 必须是64位,不要使用32位 JDK
必须将 JDK 安装在 /usr/java/jdk-version
集群的所有主机必须安装相同版本的 JDK

- 经过测试和推荐的 Oracle JDK8 版本

1.8u181	        Recommended / Latest version tested(推荐/最后测试版本)
1.8u162 Recommended(推荐)
1.8u141 Recommended(推荐)
1.8u131 Recommended(推荐)
1.8u121 Recommended(推荐)
1.8u111 Recommended(推荐)
1.8u102 Recommended(推荐)
1.8u91 Recommended(推荐)
1.8u74 Recommended(推荐)
1.8u31 Minimum required(最低要求)

- 使用 Cloudera Manager 安装 Oracle JDK

yum install -y oracle-j2sdk1.8

第三步:安装 Cloudera Manager Server

在Cloudera Manager Server主机上,键入以下命令以安装Cloudera Manager软件包

yum install -y cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server

第四步:安装和配置数据库

Cloudera Manager使用各种数据库和数据存储来存储有关Cloudera Manager配置的信息,以及诸如系统运行状况或任务进度等信息。

虽然您可以在单个环境中部署不同类型的数据库,但这样做可能会产生意外的复杂情况。Cloudera建议为所有Cloudera数据库选择一个受支持的数据库提供程序。

- 需要数据库的组件

Cloudera Manager Server:
包含有关配置的服务及角色分配、所有配置历史记录、命令、用户和正在运行的进程的所有信息
这个数据库相对较小(<100MB),但是非常重要
重启进程时,将使用 Cloudera Manager Server 数据库中保存的信息重新部署每个服务的配置
如果此信息不可用,则集群会无法启动或正常运行,所以务必安排并维护 Cloudera Manager Server 数据库的定期备份
Oozie Server:
包含 Oozie workflow, coordinator, and bundle data。可以增长到很大
Sqoop Server:
包含 entities such as the connector, driver, links and jobs。相对较小
Activity Monitor:活动监控
包含过去活动的信息,在大型集群中,此数据库可能会变的很大。只有部署了 MapReduce 服务,才需要配置活动监视数据库
Reports Manager:
跟踪磁盘利用率和处理活动的历史记录。中型
Hive Metastore Server:
包含 Hive metadata。相对较小
Hue Server:
包含 用户账户信息、作业提交和 Hive 查询。相对较小
Sentry Server:
包含授权元数据。相对较小
Cloudera Navigator Audit Server:审计服务
包含审计信息。在大型集群中,此数据库可能会变的很大
Cloudera Navigator Metadata Server:元数据服务
包含授权、策略和审计报告元数据。相对较小 Host Monitor and Service Monitor services 使用本地磁盘存储数据。

1.安装 MySQL 数据库

https://dev.mysql.com/doc/mysql-yum-repo-quick-guide/en/

https://dev.mysql.com/doc/mysql-yum-repo-quick-guide/en/

安装MySQL 5.7或更高版本后,请 不要运行mysql_secure_installation,因为Yum存储库安装已经执行了该程序的功能

## 1.设置存储库
cat <<\EOF >/etc/yum.repos.d/mysql-community.repo
[mysql57-community]
name=MySQL 5.7 Community Server
baseurl=http://repo.mysql.com/yum/mysql-5.7-community/el/7/$basearch/
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-mysql
EOF ## 2.安装 MySQL
## 这将安装MySQL server(mysql-community-server)的包以及运行服务器所需组件的包,包括client(mysql-community-client)的包,客户端和服务器的常见错误消息和字符集(mysql-community-common)以及共享客户端库(mysql-community-libs)
yum install -y mysql-community-server ## 3.启动并设置开机自动启动
systemctl enable mysqld.service
systemctl stop mysqld.service
systemctl start mysqld.service
systemctl status mysqld.service ## 4.更改初始密码
grep 'temporary password' /var/log/mysqld.log
mysql -uroot -p ALTER USER 'root'@'localhost' IDENTIFIED BY 'Xiaoliu123!';

2.修改配置以使其适用于Cloudera Manage

少于50台主机,你可以在同一主机上存储多个数据库(例如活动监视器和服务器监视器)。如果这样做,需要将每个数据库放在自己的存储卷上,为每个数据库 允许100最大连接,然后添加50个额外连接。 例如对于两个数据库,将最大连接数设置为250,如果一个主机上存储5个数据库(the databases for Cloudera Manager Server, Activity Monitor, Reports Manager, Cloudera Navigator, and Hive metastore),请将最大连接数设置为550

如果超过50台主机,不要再同一个主机上存储多个数据库,为每个数据库使用单独的主机

## 以下为 Cloudera 推荐的配置文件示例
cat <<\EOF > /etc/my.cnf
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
## 防止死锁,将隔离级别设置为 读提交
transaction-isolation = READ-COMMITTED
# Disabling symbolic-links is recommended to prevent assorted security risks;
# to do so, uncomment this line:
## 是否支持符号链接,即数据库或表可以存储在my.cnf中指定datadir之外的分区或目录,0不开启
symbolic-links = 0 #In later versions of MySQL, if you enable the binary log and do not set
#a server_id, MySQL will not start. The server_id must be unique within
#the replicating group.
## 指定 server_id
server_id=1 key_buffer_size = 32M
max_allowed_packet = 32M
thread_stack = 256K
thread_cache_size = 64
query_cache_limit = 8M
query_cache_size = 64M
query_cache_type = 1 ## 最大连接
max_connections = 550
#expire_logs_days = 10
#max_binlog_size = 100M ## 定义日志 bin log 日志路径
#log_bin should be on a disk with enough free space.
#Replace '/var/lib/mysql/mysql_binary_log' with an appropriate path for your
#system and chown the specified folder to the mysql user.
log_bin=/var/lib/mysql/mysql_binary_log ## 日志格式为混合模式
binlog_format = mixed read_buffer_size = 2M
read_rnd_buffer_size = 16M
sort_buffer_size = 8M
join_buffer_size = 8M # InnoDB settings
innodb_file_per_table = 1
innodb_flush_log_at_trx_commit = 2
innodb_log_buffer_size = 64M
innodb_buffer_pool_size = 4G
innodb_thread_concurrency = 8
## Management Service 需要写入高吞吐量,建议设置此项
## innodb使用O_DIRECT打开数据文件,使用fsync()刷写数据文件跟redo log
innodb_flush_method = O_DIRECT
innodb_log_file_size = 512M [mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid sql_mode=STRICT_ALL_TABLES
EOF

3.安装 MySQL JDBC Driver

在 Cloudera Manager Server 主机上和所有需要数据库访问的主机上安装 JDBC 驱动

Cloudera建议仅使用JDBC驱动程序的5.1版

## 1.下载 MySQL JDBC driver
## https://dev.mysql.com/downloads/connector/j/5.1.html
wget https://cdn.mysql.com//Downloads/Connector-J/mysql-connector-java-5.1.47.tar.gz ## 2.解压
tar zxvf mysql-connector-java-5.1.47.tar.gz ## 3.将重命名的 JDBC 驱动文件 COPY 到 /usr/share/java/ 目录
mkdir -p /usr/share/java/
cd mysql-connector-java-5.1.47
cp mysql-connector-java-5.1.47-bin.jar /usr/share/java/mysql-connector-java.jar

4.为 Cloudera Manager 创建数据库和用户

Databases for Cloudera Software

Service                             Database        User
Cloudera Manager Server scm scm
Activity Monitor amon amon
Reports Manager rman rman
Hue hue hue
Hive Metastore Server metastore hive
Sentry Server sentry sentry
Cloudera Navigator Audit Server nav nav
Cloudera Navigator Metadata Server navms navms
Oozie oozie oozie

创建数据库和用户,并对用户权限做授权

mysql -u root -p

CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE rman DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE nav DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE navms DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE metastore DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci; GRANT ALL ON scm.* TO 'scm'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON amon.* TO 'amon'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON rman.* TO 'rman'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON hue.* TO 'hue'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON metastore.* TO 'hive'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON sentry.* TO 'sentry'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON nav.* TO 'nav'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON navms.* TO 'navms'@'%' IDENTIFIED BY 'Xiaoliu123!';
GRANT ALL ON oozie.* TO 'oozie'@'%' IDENTIFIED BY 'Xiaoliu123!';
exit;

你可以使用以下命令查看创建的数据库

SHOW DATABASES;

查看用户授权

SHOW GRANTS FOR '<user>'@'%';

第五步:设置 Cloudera Manager 数据库

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/prepare_cm_database.html

Cloudera Manager Server包含一个可以为自己创建和配置数据库的脚本。该脚本可以:

创建Cloudera Manager Server数据库配置文件
(MariaDB,MySQL和PostgreSQL)为Cloudera Manager Server创建和配置数据库以供使用
(MariaDB,MySQL和PostgreSQL)为Cloudera Manager Server创建和配置用户帐户 /opt/cloudera/cm/schema/scm_prepare_database.sh <databaseType> <databaseName> <databaseUser> 示例:/opt/cloudera/cm/schema/scm_prepare_database.sh mysql scm scm <databaseType> 输入后端数据库类型
<databaseName> 上边为Cloudera Manager Server建立的数据库名
<databaseUser> 此数据库账号
回车后根据提示输入 scm 账号的密码 此脚本将创建数据库配置文件: /etc/cloudera-scm-server/db.properties

第六步:安装 CDH 和 其他软件

https://www.cloudera.com/documentation/enterprise/6/6.2/topics/install_software_cm_wizard.html

1.启动 Cloudera Manager Server

设置Cloudera Manager数据库后,启动Cloudera Manager Server,然后登录Cloudera Manager Admin Console:

systemctl enable cloudera-scm-server
systemctl stop cloudera-scm-server
systemctl start cloudera-scm-server
systemctl status cloudera-scm-server

2.观察启动过程

tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

    ## 当出现以下信息说明启动完毕
INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server.
## 如果启动失败,请参考以下网页进行排错
https://www.cloudera.com/documentation/enterprise/6/6.2/topics/cm_ig_troubleshooting.html#cmig_topic_19

3.登录 Cloudera Manager Admin Console

Cloudera Manager 不支持已安装的 admin 用户,但是你可以添加新用户并添加管理权限后删除 admin 账户。

http://<server_host>:7180
Username: admin
Password: admin 1.欢迎界面,点【继续】
2.许可协议,选【接受】
3.显示许可证信息,点【继续】后进入添加集群向导

4.集群向导

1.欢迎页面

Adding a cluster in Cloudera Manager consists of two steps.
在Cloudera Manager中添加群集包含两个步骤。
Add a set of hosts to form a cluster and install Cloudera Manager Agent software and CDH.
添加一组主机以形成群集并安装Cloudera Manager Agent软件和CDH。
Select and configure CDH services to run on this cluster.
选择并配置CDH服务以在此群集上运行。

2.Cluster Basics - 群集基础知识

群集名称:为集群起个名字

    A Regular Cluster contains storage nodes, compute nodes, and other services such as metadata and security collocated in a single cluster.
常规群集包含存储节点,计算节点和其他服务,例如在单个群集中并置的元数据和安全性。

3.Specify Hosts - 指定主机

在这里输入需要安装服务的主机名称或IP地址
可以使用“,”或不同的行来指定多个地址或地址范围
建议同时将 Cloudera Manager Server 一同加入,这将启用对该主机的状况监控 Cloudera Manager Server 主机需要提前跟需要被安装主机做好 SSH 互信或者在下一步提供远程主机的 root 密码 这里可以使用通配符:
10.1.1.[1-4] 10.1.1.1, 10.1.1.2, 10.1.1.3, 10.1.1.4
host[1-3].example.com host1.example.com, host2.example.com, host3.example.com
host[07-10].example.com host07.example.com, host08.example.com, host09.example.com, host10.example.com

4.选择存储库

要点:您无法在同一群集中使用parcel和包安装软件。

此步骤需要在目标主机安装 Cloudera Manager Agent

存储库选择
已经自动将前边我们在 Cloudera Manager Server 自定义的本地 YUM 仓库信息填入了 CDH and other software:
这里可以选择需在目标主机安装的角色

5.JDK 安装选项

选择:
安装 Oracle Java SE 开发工具包 (JDK)
安装 Java 无限制强度加密政策文件

6.提供 SSH 登录凭据

这里可以选择为所有主机接受相同密码和所有主机接受相同私钥,根据自己情况选择

7.Install Agents

等待安装完成

8.Install Parcels

选定的 Parcel 正在下载并安装在群集的所有主机上。等待下载完成

CDH 部署 Hadoop:5.开始安装的更多相关文章

  1. CDH 5.16.1 离线部署 & 通过 CDH 部署 Hadoop 服务

    参考 Cloudera Enterprise 5.16.x Installing Cloudera Manager, CDH, and Managed Services Installation Pa ...

  2. 离线部署 Cloudera Manager 5 和 CDH 5.12.1 及使用 CDH 部署 Hadoop 集群服务

    Cloudera Manager Cloudera Manager 分为两个部分:CDH和CM. CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera ...

  3. hadoop集群安装配置详细教程

    在上一篇的分享文章中我是给大家分享了运行部署hadoop的一些安装准备工作,这篇接上一篇继续为大家分享一些个人的学习经验总结.我学习用的是大快发行版DKHadoop,所以所有的经验分享都是以DKHad ...

  4. 使用Windows Azure的VM安装和配置CDH搭建Hadoop集群

    本文主要内容是使用Windows Azure的VIRTUAL MACHINES和NETWORKS服务安装CDH (Cloudera Distribution Including Apache Hado ...

  5. 1.5.7、CDH 搭建Hadoop在安装之前(定制安装解决方案---配置单用户模式)

    配置单用户模式 在传统的Cloudera Manager部署中,管理每台主机上的Hadoop进程的Cloudera Manager Agent以root用户身份运行.但是,某些环境会限制对root帐户 ...

  6. 2 Hadoop集群安装部署准备

    2 Hadoop集群安装部署准备 集群安装前需要考虑的几点硬件选型--CPU.内存.磁盘.网卡等--什么配置?需要多少? 网络规划--1 GB? 10 GB?--网络拓扑? 操作系统选型及基础环境-- ...

  7. 1.5、CDH 搭建Hadoop在安装之前(定制安装解决方案)

    Cloudera托管两种类型的软件存储库,您可以使用它们来安装诸如Cloudera Manager或CDH-parcel存储库和软件包存储库之类的产品. 在大多数情况下,这些存储库是有效的解决方案,但 ...

  8. 1.Hadoop集群安装部署

    Hadoop集群安装部署 1.介绍 (1)架构模型 (2)使用工具 VMWARE cenos7 Xshell Xftp jdk-8u91-linux-x64.rpm hadoop-2.7.3.tar. ...

  9. 阿里云ECS服务器部署HADOOP集群(六):Flume 安装

    本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍 一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...

随机推荐

  1. ubuntu14.04 部署nfs服务

    安装nfs服务 apt-get install nfs-kernel-server 修改配置文件,共享目录为/var/www,*号可替换为客户端IP地址,*默认为任何部署了nfs客户端的IP可以挂载该 ...

  2. 2019-2020-1 20199312《Linux内核原理与分析》第十二周作业

    实验背景 2014年9月24日,Bash中发现了一个严重漏洞shellshock,该漏洞可用于许多系统,并且既可以远程也可以在本地触发.在本实验中,学生需要亲手重现攻击来理解该漏洞,并回答一些问题. ...

  3. JQuery购物车多物品数量的加减+总价计算

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  4. php 数组的计算

    数组是我们最常用到的类型,那如何计算某个一维数组的个数呢.其实我们可以用到我们之前学过的数学函数里面的一个:count(). 我们来看看count函数的用法: int count ( mixed $变 ...

  5. MongoDB 复制集监控

    1.复制集状态查询:rs.status() 2.查看当前副本集oplog状态:rs.printReplicationInfo() 3.查看复制延迟:rs.printSlaveReplicationIn ...

  6. C# Ninject使用

    Ninject是一个IOC容器,用来解决程序中组件的耦合问题,它的目的在于做到最少配置.简单来讲就是 为我们选择一个想要的类来处理事务. 百度百科的解释:一个快如闪电.超轻量级的基于.Net平台的依赖 ...

  7. TPS与QPS,以及GMV

    TPS是指每秒处理事务的个数,处理的载体可以是单台服务器,也可以是一个服务器集群. 例如:下单接口,一秒内,下单完成次数为1000,则下单接口总 tps = 1000,共有10台服务器提供下单服务,单 ...

  8. (4)Go程序结构和流程控制

    Go程序主要由以下几部分组成:(具体可以参考2选择结构中的实例) *包声明 *导入包 *函数 *变量 *语句和表达式 *注释 流程控制 1.顺序结构 2.选择结构  (1)if else if 和 e ...

  9. redis应用场景,缓存的各种问题

    缓存 redis还有另外一个重要的应用领域——缓存 引用来自网友的图解释缓存在架构中的位置 默认情况下,我们的服务架构如下图,客户端请求service,然后service去读取mysql数据库 问题存 ...

  10. Java中判断数组是否为空

    一维数组// 一维数组: int[] arrayif(array == null || array.length == 0)    return true; 二维数组//二维数组: int[][] a ...