决定选择 Cloudera Manager 进行安装,阅读官方文档,掌握大概脉络。

        Cloudera Manager在集群已经实现ssh免秘钥登录,能够访问网络资源和本地资源的情况下,可以自动安装和配置CDH(Cloudera  distributed hadoop),以及管理在这个集群上面的服务。
       Cloudera Manager安装软件包括:
  • A small self-executing Cloudera Manager installation program to install the Cloudera Manager Server and other packages in preparation for host installation.
  • Cloudera Manager wizard for automating CDH and managed service installation and configuration on the cluster hosts. Cloudera Manager provides two methods for installing CDH and managed services: traditional packages (RPMs or
    Debian packages) or parcels. Parcels simplify the installation process, and more importantly allows you to download, distribute, and activate new minor versions of CDH and managed services from within Cloudera Manager.

他的主要功能是:

  1. Automated deployment and configuration.
  2. Customizable Monitoring and reporting.
  3. Effortless, robust troubleshooting.
  4. Zero downtime maintenance.

在安装之前,我们需要执行两个操作,很重要。关闭防火墙是防止出现访问被拒绝, SElinux也是如此。集群之间的通信很重要,确保不会因为任何限制而导致通信失败。

关闭防火墙


在Hadoop安装过程中需要关闭防火墙和SElinux,否则会异常




1.    service iptables status 查看防火墙状态

2.    使用如下命令关闭iptables,执行该命令后重启机器生效

chkconfig iptables off
关闭之后:


关闭SElinux
1.    使用getenforce命令查看是否关闭
2.    修改/etc/selinux/config 文件

将SELINUX=enforcing改为SELINUX=disabled,执行该命令后重启机器生效

SELinux (Security-Enhanced Linux)  是 美国国家安全局(NSA)对于强制访问控制的实现, 是 Linux历史上最杰出的新安全子系统。 NSA 是 在Linux社区的帮助下开发了一种访问控制体系,在这种访问控制体系的限制下,进程只能访问那些在他的任务中所需要文件。  SELinux  默认安装在Fedora 和Red Hat Enterprise Linux 上,也可以作为其他发行版上容易安装的包得到。  SELinux 是 2.6 版本的Linux 内核中提供的强制访问控制(MAC)系统。


在 Cloudera Manager部署官方解答中,有三种部署方式,这里我选择第一种,自动安装

安装路径
A — 通过 Cloudera Manager 自动安装
 - Cloudera Manager 自动安装 Oracle JDK、Cloudera Manager Server、嵌入式 PostgreSQL 数据库、Cloudera Manager Agent、CDH、管理服务软件至群集主机,并为 Cloudera Manager Server 和 Hive Metastore
以及 Cloudera Management Service 角色(可选)配置数据库。建议概念部署演示和证明使用路径,但不建议产品部署使用,因为它不能扩展,随着群集的增长可能需要进行数据库迁移。要使用此方法,服务器和群集主机必须满足以下要求:

  • 可使用根帐户或具有无密码权限的账户登录 Cloudera Manager Server 主机。
  • 允许 Cloudera Manager Server 主机在同一端口具有统一的 SSH 访问,可访问所有主机。更多信息,请参阅 网络和安全要求
  • 所有主机必须具有访问标准软件包存储库以及 archive.cloudera.com 或包含必要安装文件的本地存储库的权限。
对于以上三点要求,我的集群是满足的,之前配置了hadoop用户之间的免秘钥登录,所有主机都可以访问网络。

Pre-requisites: multiple, Internet-connected Linux machines, with SSH access, and significant free space in /var and /opt. 确认之后 三部到位

$ wget http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.bin
$ chmod u+x cloudera-manager-installer.bin
$ sudo ./cloudera-manager-installer.bin

最后一步的时候,报错,hadoop不在superdoers中。进行配置即可。
 vi /etc/sudoers

增加 hadoop ALL=(ALL) ALL
这一步是赋予用户hadoop所有root的权限。
执行第三步:

接下来一些列对话框,跳过即可,接着就是安装jdk

解决:我删除了 /etc/yum.repos.d/下面的几个repo文件:

-rw-r--r--  1 root root  195 Oct 19 14:54 cloudera-manager.repo
-rw-r--r--  1 root root  195 Oct 19 14:54 cloudera-manager.repo.rpmnew
-rw-r--r--  1 root root  290 Dec 10 02:21 cloudera-manager.repo.rpmsave

然后重新安装就回复正常了,可能是之前我独自下载了一个repo文件的问题。

然后怎么知道正在安装呢?我想的是安装流量监控软件看网络是否有下载网速。

iptraf软件是一个监控网络的好工具,安装在这里不在介绍,点击这个链接查看详细步骤。


我得到了我的机器的下载jdk的网速:

可见网速十分缓慢。可能是办公室网络比较慢,用的源是越南的,而我所在地没有源,所以速度也就只能这样了。

到这里想起月凤先生讲过的一些道理。顺势而为,顺其自然是最好的方式,网速既然只有这样,那就这样最好。请耐心等待变盘的时刻。


耐心等待下终于安装好了,接下来安装server,中间等待的时间可能有10多分钟,一定要有耐心,不然中途退出就不好了。这个安装界面因为进度条显示不是实时的,总怀疑是不是出了什么问题,所以在这之前安装一个网络监控软件是一个很不错的选择,对于我这种需要安全感的人而言,看到网络tcp保持连接有网速,就觉得安心,也就不会怀疑停在这个界面是不是出了什么问题。

当然,另外一个好的选择就是 tail -f /var/log/cloudera-manager-installer/3.install-cloudera-manager-server.log 查看日志,不过也不是实时的貌似。

                                         +------------------ Installing ------------------+
                                         | .           Cloudera Manager Server          . |
                                         |                      40%                       |
                                         |            cloudera-manager-server             |
                                         |                                                |
                                         +------------------------------------------------+


这个时候的网速还是很快的:

可能因为cdh太大,还是要等待很长时间才会完成。粗略计算:jdk130MB+server 
Total download size: 481 M 一共需下载600MB,需要二十分钟到三十分钟。



完成安装之后:
+--------------------------------------------------------- Next step ----------------------------------------------------------+  
  | Point your web browser to  http://node1.com:7180/. Log in to Cloudera Manager with username: 'admin' and password: 'admin' to |  
  | continue installation. (Note that the hostname may be incorrect. If the url does not work, try the hostname you use when     |  
  | remotely connecting to this machine.) If you have trouble connecting, make sure you have disabled firewalls, like iptables.  |  
  |------------------------------------------------------------------------------------------------------------------------------|  
  |                                                            < OK >                                                            |  
  +------------------------------------------------------------------------------------------------------------------------------+  

看到node1.com,我们需要在其他机器上打开这个链接,因此在本地计算机配置hosts文件加入:

192.168.122.128    node1.com
192.168.122.129    node2.com
192.168.122.130    node3.com


打开链接,显示登录框,表示我们安装成功:

接下来进行CDH的安装了。


Charles 于2015-12-17 Phnom Penh



版权说明:
本文由Charles Dong原创,本人支持开源以及免费有益的传播,反对商业化谋利。
CSDN博客:http://blog.csdn.net/mrcharles
个人站:http://blog.xingbod.cn
EMAIL:charles@xingbod.cn

hadoop再次集群搭建(4)-Cloudera Manager Installation的更多相关文章

  1. hadoop再次集群搭建(5)-CDH Install

       登录 http://node1.com:7180/.用户名和密码都是admin.启动服务命令是 service  cloudera-scm-server start 最开始两个页面直接conti ...

  2. hadoop再次集群搭建(3)-如何选择相应的hadoop版本

    之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题. 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费. (2) 是否有 ...

  3. hadoop再次集群搭建(1)-安装系统

    从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了.其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout.个人对算法比较感兴 ...

  4. hadoop再次集群搭建(2)-配置免秘钥ssh登录

    SSH对于大多程序员都不陌生,目前主流的云服务提供上也是通过SSH来提供链接的安全保障,比如AWS通过使用下载的私钥(private key)实现与EC2实例安全连接.GitHub通过上传的公钥(pu ...

  5. Hadoop+HBase 集群搭建

    Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...

  6. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  7. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  8. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

  9. Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04

    前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

随机推荐

  1. Nagios的基本安装配置

    //////////////////////nagios//////////////////////nagios原理:http://www.linuxidc.com/Linux/2013-11/927 ...

  2. 小米刷机教程和GAE for android

    小米上的刷机教程:http://www.miui.com/getrom.php?r=2gae for android :https://github.com/madeye/gaeproxy/wiki

  3. hdu-2609-How many(串的最小表示)

    题目链接 /* Name:hdu-2609-How many Copyright: Author: Date: 2018/4/24 15:47:49 Description: 串的最小表示 求出每个串 ...

  4. Python中类的约束

    如何在python中进行类的约束 使某些类必须有一些方法 1 python 的抽象类实现 === 约束性不高 Python是 解释性语言 from abc import ABCMeta from ab ...

  5. spring学习-3

    spring的自动装配 spring IOC容器可以自动装配bean,只需要在bean的autowire属性指定自动装配的模式. 模式: 1.byType:根据类型自动装配.根据bean的类型和当前b ...

  6. fiddler抓包

    1.fiddler安装 下载exe安装文件,傻瓜式安装 2.fiddler配置 点击Tools -->Telerik Fiddler Options -->Https,进入以下对话框 Ht ...

  7. fastCGI模块

    这个模块允许nginx同FastCGI协同工作,并且控制哪些参数将被安全传递.例: location / { fastcgi_pass localhost:9000; fastcgi_index in ...

  8. NET持续集成与自动化部署

    https://www.cnblogs.com/hunternet/p/9590287.html 相信每一位程序员都经历过深夜加班上线的痛苦!而作为一个加班上线如家常便饭的码农,更是深感其痛.由于我们 ...

  9. LintCode Sliding Window Matrix Maximum

    原题链接在这里:http://www.lintcode.com/zh-cn/problem/sliding-window-matrix-maximum/ 题目: Given an array of n ...

  10. ACM学习历程—2016"百度之星" - 资格赛(Astar Round1)

    http://bestcoder.hdu.edu.cn/contests/contest_show.php?cid=690 A题: 给定字符串,求任意区间的Hash值. 根据题目给定的Hash方式,属 ...