大家都知道,Apache Hadoop的配置很繁琐,而且很零散,为此Cloudera公司提供了Clouder Manager工具,而且还封装了Apache Hadoop,flume,spark,hive,hbase等大数据产品形成自己特色的CDH产品,再使用CM进行安装,很大程度上方便了集群的搭建,并提供了集群的监控功能。

一、环境:

1.三台VMware虚拟机(一个做为主节点,两个做为从节点)

hserver1n(主节点) hserver2n(从节点) hserver3n(从节点)
CM Server    
CM Agent CM Agent CM Agent
NameNode DateNode DateNode
Mysql    

2.操作系统:Centos7

3.Cloudera Manager:5.14.1

4.CDH:5.14.0

5.JDK1.8

二、软件下载地址

1.Cloudera Manager

2.CDH

3.JDK和MySQL自行搜索

三、系统环境设置:

以下步骤都使用root用户操作

1.设置静态IP

  1. [root@localhost ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33
  2. TYPE="Ethernet"
  3. BOOTPROTO="static"
  4. DEFROUTE="yes"
  5. PEERDNS="yes"
  6. PEERROUTES="yes"
  7. IPV4_FAILURE_FATAL="no"
  8. IPV6INIT="yes"
  9. IPV6_AUTOCONF="yes"
  10. IPV6_DEFROUTE="yes"
  11. IPV6_PEERDNS="yes"
  12. IPV6_PEERROUTES="yes"
  13. IPV6_FAILURE_FATAL="no"
  14. IPV6_ADDR_GEN_MODE="stable-privacy"
  15. NAME="ens33"
  16. UUID="edcb54db-f59d-4893-bd8e-8ae60d0ba6f9"
  17. DEVICE="ens33"
  18. ONBOOT="yes"
  19. GATEWAY=192.168.124.2
  20. IPADDR=192.168.124.136
  21. NETMASK=255.255.255.0
  22. DNS1=202.96.128.86
  23. DNS2=223.5.5.5

还需要设置虚拟网络:

(1) 点击虚拟网络编辑器

(2)子网,子网掩码,以及NAT设置

(3)虚拟机网络选择刚设置的VMnet8

(4)重启网络

  1. [root@localhost ~]# systemctl restart network

2.关闭防火墙和SELINUX

  1. [root@localhost ~]# vim /etc/selinux/config .config/
  2. selinux=enforcing改成selinux=disabled

重启虚拟机

3.安装JDK

CentOS7默认安装的是OpenJDK,所以需要先卸载,然后安装Oracle JDK.

4.设置主机名(CentOS7与CentOS6主机名设置不同,请参考此博文)

  1. 1vim /etc/hostname
  2.  
  3. hserver1n
  4.  
  5. (2)hostname hserver1n

单台虚拟机设置好后,再复制两台虚拟机,修改HostName、IP、UUID即可。

5.配置三台虚拟机的Host文件

192.168.124.136  hserver1n

192.168.124.137  hserver2n

192.168.124.138  hserver3n

6.打通主节点SSH访问两个从节点

7.配置所有节点NTP时间同步服务

两个从节点同步主节点的时间

四、安装MySQL

  • mysql只需在主节点安装
  • mysql5.6开始mysql服务启动时会为root用户生成一个临时密码,通过grep 'password'  /var/log/mysqld.log命令获取
  • 配置密码验证策略,我选择的是不使用密码验证策略,以便创建简单密码
  • 配置数据库字符集,我配置默认的字符集是utf8。

五、安装Clouder Manager及CDH

所有节点操作:

1.新建目录

  1. $ sudo mkdir /opt/cloudera-manager

2.将下载的Clouder Manager解压到此目录下

  1. $ sudo tar xzf cloudera-manager*.tar.gz -C /opt/cloudera-manager

3.创建用户cloudera-scm

由于Cloudera Manager和Managed Services默认使用cloudera-scm,所以需要创建此用户

  1. $ sudo useradd --system --home=/opt/cloudera-manager/cm-5.14.1/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

4.主节点创建Cloudera Manager服务本地数据存储目录

  1. $ sudo mkdir /var/lib/cloudera-scm-server
  2. $ sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-server

5.配置Agent

配置所有节点的Agent,路径:/opt/cloudera-manager/cm-5.14.1/etc/cloudera-scm-agent/config.ini,将server_host修改成主节点的主机名,如果主节点端口没有自定义,则不用修改。

6.下载mysql-connector-java.jar,并保存到所有主机的/usr/share/java目录下

7.配置mysql,可以参考这里

7.1 mysql安装在主节点上,使用mysql命令登录

7.2 新建一个scm用户,并赋予所有权限,密码是scm

  1. mysql> grant all on *.* to 'scm'@'localhost' identified by 'temp' with grant option;
  2. Query OK, 0 rows affected, 1 warning (0.00 sec)

7.3 创建数据库scm

7.4 初始化cloudera manager

  1. [root@hserver1n ~]# /opt/cloudera-manager/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh mysql scm scm scm
  2.  
  3. JAVA_HOME=/usr/java/jdk1.7.0_80
  4. Verifying that we can write to /opt/cloudera-manager/cm-5.14.1/etc/cloudera-scm-server
  5. Creating SCM configuration file in /opt/cloudera-manager/cm-5.14.1/etc/cloudera-scm-server
  6. Executing: /usr/java/jdk1.7.0_80/bin/java -cp /usr/share/java/mysql-connector-java.jar:/usr/share/java/oracle-connector-java.jar:/opt/cloudera-manager/cm-5.14.1/share/cmf/schema/../lib/* com.cloudera.enterprise.dbutil.DbCommandExecutor /opt/cloudera-manager/cm-5.14.1/etc/cloudera-scm-server/db.properties com.cloudera.cmf.db.
  7. Wed Mar 21 14:09:40 CST 2018 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by default if explicit option isn't set. For compliance with existing applications not using SSL the verifyServerCertificate property is set to 'false'. You need either to explicitly disable SSL by setting useSSL=false, or set useSSL=true and provide truststore for server certificate verification.
  8. [ main] DbCommandExecutor INFO Successfully connected to database.
  9. All done, your SCM database is configured correctly!

当看最后一句话,就说明初始化成功了

注意scm账户不能删除,因为cm以后还需要使用此账户,若想创建临时用户,则需要让CM创建用户和数据库,此时可以删除创建的临时用户。

可以使用命令:

  1. /opt/cloudera-manager/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh mysql -utemp -ptemp scm scm scm

8.将CDH安装包移动主节点的/opt/cloudera/parcel-repo目录下

移动的文件有:

将CDH-5.14.0-1.cdh5.14.0.p0.24-el7.parcel.sha1名称改成CDH-5.14.0-1.cdh5.14.0.p0.24-el7.parcel.sha

9.启动主节点的CM  Server和所有节点的Agent

路径为:/opt/cloudera-manager/cm-5.14.1/etc/init.d

  1. [root@hserver1n init.d]# ./cloudera-scm-server start
  2. Starting cloudera-scm-server: [ OK ]
  3. [root@hserver1n init.d]# ./cloudera-scm-agent start
  4. Starting cloudera-scm-agent: [ OK ]

10.打开CM管理页面,网址为:http://hserver1n:7180,

用户名和密码都是admin

11.选择Cloudera Express

12.选择主机

13.群集安装

14.安装完成后,检查主机正确性

其中有两项需要修改,一个是修改swapping阀值,从30修改成10,已最大限度使用内存,第二项是关闭透明大页面压缩功能,提高性能。

15.选择要安装的服务,这里选择核心Hadoop,以后需要安装其它服务时,再根据需要安装

16.角色分配,尽量让角色均衡地分配到所有主机上,以减少某一台主机的压力

17.创建数据库用户,及相关数据库,并配置服务

  1. mysql> grant all on *.* to 'yanggy'@'%' identified by '878963' with grant option;
  2. Query OK, 0 rows affected, 1 warning (0.03 sec)
  3.  
  4. mysql> create database hive;
  5. Query OK, 1 row affected (0.01 sec)
  6.  
  7. mysql> create database hue;
  8. Query OK, 1 row affected (0.01 sec)
  9.  
  10. mysql> create database ooz;
  11. Query OK, 1 row affected (0.00 sec)

18.集群相关服务的配置

HDFS块大小默认是128M,我这里为测试方便,只配置了16M,其它的配置一些数据目录,日志目录,以及端口

19.集群搭建完成,并启动了相关服务

20.集群安装合成后的初始界面,可以很明显的看到集群中安装的服务和运行状况,红叹号是集群中某些配置、空间与CM期望的不一样,可以根据实际情况调整。

Cloudera Manager及CDH最新版本安装全程记录的更多相关文章

  1. Cloudera Manager 和 CDH 4 终极安装

    转载请注明出处:http://www.cnblogs.com/thinkCoding/p/3567408.html 系统环境 操作系统:CentOS 6.5 Cloudera Manager 版本:4 ...

  2. Cloudera Manager、CDH零基础入门、线路指导 http://www.aboutyun.com/thread-9219-1-1.html (出处: about云开发)

    Cloudera Manager.CDH零基础入门.线路指导http://www.aboutyun.com/thread-9219-1-1.html(出处: about云开发) 问题导读:1.什么是c ...

  3. CentOS 7下Cloudera Manager及CDH 6.0.1安装过程详解

    目录 一.概念介绍 1.CDH 概览 2.Cloudera Manager 概览 二.环境准备 1.软件版本选择 2.节点准备(四个节点) 3.配置主机名和hosts解析(所有节点) 4.关闭防火墙 ...

  4. 2、CDH 搭建Hadoop在安装(安装Cloudera Manager,CDH和托管服务)

    安装Cloudera Manager,CDH和托管服务 建议使用此过程为生产环境安装Cloudera Manager和CDH.对于非生产“易于安装”,请参阅安装概念证明群集. 在开始安装之前,请确保已 ...

  5. (转)Installing Cloudera Manager and CDH

    转:https://blog.csdn.net/qq_26222859/article/details/79976506 译自官网: Installing Cloudera Manager and C ...

  6. canal-adapter1.1.14最新版本安装的过程中出现的NullPointerException异常

    记录一下我在安装 canal-adapter1.1.14最新版本安装的过程中出现的NullPointerException异常 以下是我的canal-adapter/logs文件夹内adapter.l ...

  7. Cloudera Manager和CDH安装部署

    本次安装采用离线安装的方式,需要提前下载好需要的包. 1. 准备工作 1.1 环境说明 操作系统:RedHat企业级Linux6.5 64-bit Cloudera Manager:5.8.4 CDH ...

  8. Cloudera Manager和CDH版本的对应关系

    来源:https://www.cloudera.com/documentation/enterprise/release-notes/topics/rn_consolidated_pcm.html#c ...

  9. Cloudera Manager 5和CDH5离线安装

    CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Had ...

随机推荐

  1. 2017第八届蓝桥杯 K倍区间

    标题: k倍区间 给定一个长度为N的数列,A1, A2, - AN,如果其中一段连续的子序列Ai, Ai+1, - Aj(i <= j)之和是K的倍数,我们就称这个区间[i, j]是K倍区间. ...

  2. uva437 DAG

    直接套用DAG的思路就行. AC代码: #include<cstdio> #include<cstring> #include<algorithm> using n ...

  3. vim编辑器——常用操作整理

    注意:以下的操作都是在命令状态下进行的,不要进入插入状态了.参考这里 1.删除 dd       删除一行 ndd    删除以当前行开始的n行dw    删除以当前字符开始的一个字符ndw   删除 ...

  4. sqlserver中select造成死锁

    死锁过程: select语句使用非聚族索引查询产量信息,会对非聚族索引添加共享锁,由于非聚族索引上没有select的全部数据列,(所以会有书签查找出现,)需要查询产量表.查询产量表时,需要对产量表数据 ...

  5. xp+WinDBG+VMware调试内核

    呵呵,搞点突兀的标题而已.其实说的还是如何使用WinDBG和VMware来搭建调试内核的环境而已,这些网上已经有数不清的教程了,不过我喜欢自己亲手写一下.第一,把这个过程写一遍能加深印象,就算以后忘记 ...

  6. mysql 查询表死锁 和结束死锁的表步骤

    1.查询是否锁表 show OPEN TABLES ; 2.查询进程 show processlist 查询到相对应的进程===然后 kill    id 3.查看正在锁的事务 SELECT * FR ...

  7. windows下使用docker安装tensorflow

    一.安装Docker 1.首先先按照docker,从https://get.daocloud.io/toolbox/  下载exe文件就好 双击安装会多出来三个东西: Oracle VM Virtua ...

  8. echarts中的option.legend.data has not been defined.

    1.错误描述 2.错误原因 var map = function(mapData){ require( [ 'echarts', 'echarts/chart/map' ], function (ec ...

  9. 错误代码: 1242 Subquery returns more than 1 row

    1. 错误描述 1 queries executed, 0 success, 1 errors, 0 warnings 查询:SELECT t.id, DATE_FORMAT( t.statisTim ...

  10. How I explained OOD to my wife(转)

    How I explained OOD to my wife Learning Object Oriented Design principles through interesting conver ...