CDH 安装

市场上免费大数据框架主要有三个版本,原生的 Apache 版本,Cloudera(https://www.cloudera.com/) 公司研发的(Cloudera Distribution Hadoop,简称“CDH”)CDH 版本,也是市场上使用最多的,Hortonworks 版本(Hortonworks Data Platform,简称“HDP”)

cm-cloudera managerment 下载地址:https://www.cloudera.com/downloads/manager/5-16-1.html

cdh-5.16.1 载地址:http://archive.cloudera.com/cdh5/parcels/5.16.1/

一、系统环境搭建

(1) 网络配置

  1. vi /etc/hosts

(2) SSH 免密码登录

  1. # 所有设备生成公钥
  2. ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  3. # 直接远程授权,这样 master 通过 ssh 就可以远程登录本机了,所有设备(包括自己)均拷贝公钥到 master
  4. ssh-copy-id root@master
  5. # 将 master 的公钥分发到所有设备上,这样所有的设备就互相互信完成了
  6. scp ~/.ssh/authorized_keys root@slave1

更多 SSH 免密码登录详见:https://www.cnblogs.com/binarylei/p/9049149.html

(3) 关闭防火墙和 SELINUX

  1. # 关闭防火墙
  2. systemctl stop firewalld
  3. systemctl disable firewalld # 永久关闭防火墙
  4. # 关闭 SELINUX
  5. setenforce 0
  6. vi /etc/selinux/config (SELINUX=disabled)

(4) 安装 JDK

(5) 安装 MySQL

MySQL 版本选择 5.6,安装详见:https://www.cnblogs.com/binarylei/p/9026422.html

(6) ntp 时间同步

  1. yum install ntp # 安装 ntp
  2. systemctl start ntpd # 启动
  3. systemctl enable ntpd # 设置开机自启动

ntp 时间同步配置:修改 /etc/ntp.conf 文件,注释掉外网时间服务器,添加本地服务器即可

  1. vi /etc/ntp.conf
  2. server 192.168.180.190 # 添加此行
  3. #server 0.centos.pool.ntp.org iburst # 以下四行注释掉
  4. #server 1.centos.pool.ntp.org iburst
  5. #server 2.centos.pool.ntp.org iburst
  6. #server 3.centos.pool.ntp.org iburst

(7) 下载依赖包

CentOS 需要安装以下依赖,如果是其它操作系统可能不一样

  1. yum -y install chkconfig python bind-utils psmisc libxslt zlib sqlite cyrus-sasl-plain cyrus-sasl-gssapi fuse portmap fuse-libs redhat-lsb

二、Cloudera Manager Service 安装

(1) 安装 Cloudera Manager Server 和 Agent

  1. mkdir -p /opt/cloudera-manager
  2. tar -zxvf cloudera-manager-el7-cm5.16.1_x86_64.tar.gz -C /opt/cloudera-manager/
  3. # 修改 CM 的配置文件
  4. vi /opt/cloudera-manager/cm-5.16.1/etc/cloudera-scm-agent
  5. server_host=CDH-01
  6. server_port=7182
  7. # 分发
  8. scp -r /opt/cloudera-manager root@CDH-02:/opt
  9. scp -r /opt/cloudera-manager root@CDH-03:/opt

(2) 创建用户(用户名固定 cloudera-scm)

  1. useradd
  2. --system # 表示创建的是一个系统用户
  3. --no-create-home # 不在创建主目录
  4. --shell=/bin/false # 不作用服务器的登陆用户
  5. --comment "Cloudera SCM User" # 备注
  6. cloudera-scm # 用户名

验证:

  1. cat /etc/passwd | grep cloudera-scm

(3) 配置 CM Server 数据库

  1. # 执行下面的命令后会创建 scm 的数据库和 scm 的账号
  2. /opt/cloudera-manager/cm-5.16.1/share/cmf/schema/scm_prepare_database.sh
  3. -h CDH-01 -uroot -p123456 --scm-host CDH-01 mysql scm scm scm

报错: 缺少驱动包 java.lang.ClassNotFoundException: com.mysql.jdbc.Driver

解决:

将驱动包放入当前服务器的 /usr/share/java 目录下,将分发到其到节点上。CM 管理的集群(hive sqoop)都会默认到 /usr/share/java 下找驱动包。 注意:mysql-connector-java.jar 名称不能更改

(3) 创建 Parcel 源

  1. 1)创建目录
  2. mkdir -p /opt/cloudera/parcel-repo # 在 server上创建
  3. mkdir -p /opt/cloudera/parcels # 在所有的 agent 节点上创建
  4. mkdir -p /opt/cloudera-manager/cm-5.16.1/run/cloudera-scm-agent # 在所有的 agent 节点上创建
  5. 2)将 CDH 的源移动到 sever parcel-repo 目录下
  6. 3)修改校验码文件名称
  7. mv CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha1 CDH-5.16.1-1.cdh5.16.1.p0.3-el7.parcel.sha
  8. 4)修改 parcel-repo parcels 目录的所属人
  9. chown -R cloudera-scm:cloudera-scm /opt/cloudera/parcel-repo/ # 在 server 上
  10. chown -R cloudera-scm:cloudera-scm /opt/cloudera/parcels # 在 agent 上

(4) 启动 CM Server 和 Agent

  1. # 启动 server 和 agent 服务
  2. /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-server start
  3. /opt/cloudera-manager/cm-5.16.1/etc/init.d/cloudera-scm-agent start

日志查看 tail –f /opt/cloudera-manager/cm-5.16.1/log/cloudera-scm-server/cloudera-scm-server.log

web 页面 192.168.180.100:7180


每天用心记录一点点。内容也许不重要,但习惯很重要!

CDH 安装的更多相关文章

  1. cdh 安装记录

    安装文件准备 CDH 下载地址:http://archive.cloudera.com/cdh5/parcels/latest/ 下载操作系统对应的版本: 1.CDH-5.3.0-1.cdh5.3.0 ...

  2. CDH 安装遇到的问题

    CDH  遇到的问题 l JAVA_HOME问题 这里, 很明显可以看到, JAVA_HOME 并没有设置成功.using  as ... 感觉完全就是没有设置JAVA_HOME 这个环境变量.可是呢 ...

  3. CDH安装详细测试正确

    1. CDH简介 简单来说,Cloudera Manager是一个拥有集群自动化安装.中心化管理.集群监控.报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到 ...

  4. CDH安装错误集锦

      CDH安装过程中出现的错误 1.iptables: /sbin/iptables 不存在 我是因为误删将 /sbin/下的文件删除了. 解决方法: yum install iptables 2.c ...

  5. CDH6.2安装配置第二篇:CDH安装的前期配置

    本篇介绍cdh安装之前需要的一些必要配置,当然这些配置也可以用shell脚本来配置.在安装之前请先配置好yum源,在文中用的统一都是阿里源.在安装的时候,要确保主机的内存是4G以上,要不然会无限重启c ...

  6. CDH安装失败了,如何重新安装

    1> 删除Agent节点的UUID # rm -rf /opt/cm-5.4.7/lib/cloudera-scm-agent/* 2>  清空主节点CM数据库 进入主节点的Mysql数据 ...

  7. CDH安装

    离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程 关于CDH和Cloudera Manager CDH (Cloudera's Distribution, incl ...

  8. CM+CDH安装遇到的问题

    1.实在是在安装CDH的时候无法安装成功的话,只有重新启动了,下面给大家分享一个神器,按照这个脚本应该差不多就能卸载干净,然后重新安装,写一个脚本,内容如下,救命的神器呀: #!/bin/bash s ...

  9. CDH安装Hadoop

    一.安装CDH-manager 1.关闭selinux 修改/etc/selinux/config 文件 将SELINUX=enforcing改为SELINUX=disabled 重启机器即可   2 ...

随机推荐

  1. PTA上Java问题自查与提问方法

    自查 首先请一定先看这篇文章<PTA中提交Java程序的一些套路>.该文囊括了PTA中提交Java程序的几乎所有常见问题,请仔细阅读可以少踩很多坑 题目测试方法:复制样例输入,然后打开一个 ...

  2. PAT 甲级 1027 Colors in Mars (20 分)

    1027 Colors in Mars (20 分) People in Mars represent the colors in their computers in a similar way a ...

  3. Percona XtraDB Cluster vs Galera Cluster vs MySQL Group Replication

    Percona XtraDB Cluster vs Galera Cluster vs MySQL Group Replication Overview Galera Cluster 由 Coders ...

  4. 开源ERP系统Odoo搭建文档

    本文参考链接地址: https://devecho.com/v/209/ https://www.cnblogs.com/wxylog/p/6386974.html 什么是Odoo 为什么选择Odoo ...

  5. NodeJS学习之win10安装与sublime配置

    Window 上安装Node.js Node.js安装包及源码下载地址为:https://nodejs.org/en/download/ 下载安装就行了,安装node会同时安装npm. sublime ...

  6. leetcode300

    本题使用回溯法,深度优先搜索.使用隐式条件来进行加速. public class Solution { ; int[] x; Dictionary<int, int> dic = new ...

  7. 【FZSZ2017暑假提高组Day2】圆盘时钟

    [问题描述] 作为出题人的小Z相信大家对上图这样的圆盘时钟都不会陌生——在理想圆盘时钟上,秒针每一分钟转一圈,分针每一小时转一圈,时针每12小时转一圈,它们均是匀速转动的,在0点时三条针均指向表盘上的 ...

  8. matlab中变量问题——readonly 索引超出矩阵维度 workspacefunc 215

    matlab程序运行过程中会出现如上提示,在网上检索未果,键入dbstop if error语句也无法定错误之处,就想这个错误不是一般的错误. 通过间隔打断点的方式最后定位错误为一句exist = f ...

  9. MFC笔记3

    1. C6有默认的提示代码功能,但是其默认的快捷键是Ctrl + Space,这一般情况下是切换输入法快捷键,所以,只需重新设置一下快捷键就可以实现提示代码功能,具体设置位置如下: 工具(T) -&g ...

  10. IOC 和DI(转载)

    IOC 是什么? Ioc—Inversion of Control,即“控制反转”,不是什么技术,而是一种设计思想.在Java开发中,Ioc意味着将你设计好的对象交给容器控制,而不是传统的在你的对象内 ...