1.概述

　　最近，有朋友私密我，Hadoop有什么好的监控工具，其实，Hadoop的监控工具还是蛮多的。今天给大家分享一个老牌监控工具Ganglia，这个在企业用的也算是比较多的，Hadoop对它的兼容也很好，不过就是监控界面就不是很美观。下次给大家介绍另一款工具——Hue，这个界面官方称为Hadoop UI，界面美观，功能也比较丰富。今天，在这里主要给大家介绍Ganglia这款监控工具，介绍的内容主要包含如下：

Ganglia背景
Ganglia安装部署、配置
Hadoop集群配置Ganglia
启动、预览Ganglia

　　下面开始今天的内容分享。

2.Ganglia背景

　　Ganglia是UC Berkeley发起的一个开源集群监视项目，设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能，如：cpu 、mem、硬盘利用率， I/O负载、网络流量情况等，通过曲线很容易见到每个节点的工作状态，对合理调整、分配系统资源，提高系统整体性能起到重要作用。

　　Ganglia其核心由3部分组成：

gmond：运行在每个节点上监视并收集节点信息，可以同时收发统计信息，它可以运行在广播模式和单播模式中。
gmetad：从gmond以poll的方式收集和存储原数据。
ganglia-web：部署在gmetad机器上，访问gmetad存储的元数据并由Apache Web提高用户访问接口。

　　下面，我们来看看Ganglia的架构图，如下图所示：

　　从架构图中，我们可以知道Ganglia支持故障转移，统计可以配置多个收集节点。所以我们在配置的时候，可以按需选择去配置Ganglia，既可以配置广播，也可以配置单播。根据实际需求和手上资源来决定。

3.Ganglia安装部署、配置

3.1安装

　　本次安装的Ganglia工具是基于Apache的Hadoop-2.6.0，若是未安装Hadoop集群，可以参考我写的《配置高可用的Hadoop平台》。另外系统环境是CentOS 6.6。首先，我们下载Ganglia软件包，步骤如下所示：

第一步：安装yum epel源

[hadoop@nna ~]$ rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm

第二步：安装依赖包

[hadoop@nna ~]$ yum -y install httpd-devel automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig

第三步：查看Ganglia安装包

[hadoop@nna ~]$ yum search ganglia

　　然后，我为了简便，把Ganglia安装全部安装，安装命令如下所示：

第四步：安装Ganglia

[hadoop@nna ~]$ yum -y install ganglia*

　　最后等待安装完成，由于这里资源有限，我将Ganglia Web也安装在NNA节点上，另外，其他节点也需要安装Ganglia的Gmond服务，该服务用来发送数据到Gmetad，安装方式参考上面的步骤。

3.2部署

　　在安装Ganglia时，我这里将Ganglia Web部署在NNA节点，其他节点部署Gmond服务，下表为各个节点的部署角色：

节点	Host	角色
NNA	10.211.55.26	Gmetad、Gmond、Ganglia-Web
NNS	10.211.55.27	Gmond
DN1	10.211.55.16	Gmond
DN2	10.211.55.17	Gmond
DN3	10.211.55.18	Gmond

　　Ganglia部署在Hadoop集群的分布图，如下所示：

3.3配置

　　在安装好Ganglia后，我们需要对Ganglia工具进行配置，在由Ganglia-Web服务的节点上，我们需要配置Web服务。

ganglia.conf

[hadoop@nna ~]$ vi /etc/httpd/conf.d/ganglia.conf

　　修改内容如下所示：

#

# Ganglia monitoring system php web frontend

#

Alias /ganglia /usr/share/ganglia

<Location /ganglia>

  Order deny,allow

  # Deny from all

  Allow from all

  # Allow from 127.0.0.1

  # Allow from ::1

  # Allow from .example.com

</Location>

　　注：红色为添加的内容，绿色为注销的内容。

gmetad.conf

[hadoop@nna ~]$ vi /etc/ganglia/gmetad.conf

　　修改内容如下所示：

data_source "hadoop" nna nns dn1 dn2 dn3

　　这里“hadoop”表示集群名，nna nns dn1 dn2 dn3表示节点域名或IP。

gmond.conf

[hadoop@nna ~]$ vi /etc/ganglia/gmond.conf

　　修改内容如下所示：

/*

 * The cluster attributes specified will be used as part of the <CLUSTER>

 * tag that will wrap all hosts collected by this instance.

 */

cluster {

  name = "hadoop"

  owner = "unspecified"

  latlong = "unspecified"

  url = "unspecified"

}

/* Feel free to specify as many udp_send_channels as you like.  Gmond

   used to only support having a single channel */

udp_send_channel {

  #bind_hostname = yes # Highly recommended, soon to be default.

                       # This option tells gmond to use a source address

                       # that resolves to the machine's hostname.  Without

                       # this, the metrics may appear to come from any

                       # interface and the DNS names associated with

                       # those IPs will be used to create the RRDs.

  # mcast_join = 239.2.11.71

  host = 10.211.55.26

  port =

  ttl =

}

/* You can specify as many udp_recv_channels as you like as well. */

udp_recv_channel {

  # mcast_join = 239.2.11.71

  port =

  bind = 10.211.55.26

  retry_bind = true

  # Size of the UDP buffer. If you are handling lots of metrics you really

  # should bump it up to e.g. 10MB or even higher.

  # buffer =

}

　　这里我采用的是单播，cluster下的name要与gmetad中的data_source配置的名称一致，发送节点地址配置为NNA的IP，接受节点配置在NNA上，所以绑定的IP是NNA节点的IP。以上配置是在有Gmetad服务和Ganglia-Web服务的节点上需要配置，在其他节点只需要配置gmond.conf文件即可，内容配置如下所示：

/* Feel free to specify as many udp_send_channels as you like.  Gmond

   used to only support having a single channel */

udp_send_channel {

  #bind_hostname = yes # Highly recommended, soon to be default.

                       # This option tells gmond to use a source address

                       # that resolves to the machine's hostname.  Without

                       # this, the metrics may appear to come from any

                       # interface and the DNS names associated with

                       # those IPs will be used to create the RRDs.

  # mcast_join = 239.2.11.71

  host = 10.211.55.26

  port =

  ttl =

}

/* You can specify as many udp_recv_channels as you like as well. */

udp_recv_channel {

  # mcast_join = 239.2.11.71

  port =

  # bind = 10.211.55.26

  retry_bind = true

  # Size of the UDP buffer. If you are handling lots of metrics you really

  # should bump it up to e.g. 10MB or even higher.

  # buffer =

}

4.Hadoop集群配置Ganglia

　　在Hadoop中，对Ganglia的兼容是很好的，在Hadoop的目录下/hadoop-2.6.0/etc/hadoop，我们可以找到hadoop-metrics2.properties文件，这里我们修改文件内容如下所示，命令如下所示：

[hadoop@nna hadoop]$ vi hadoop-metrics2.properties

　　修改内容如下所示：

namenode.sink.ganglia.servers=nna:

#datanode.sink.ganglia.servers=yourgangliahost_1:,yourgangliahost_2:

resourcemanager.sink.ganglia.servers=nna:

#nodemanager.sink.ganglia.servers=yourgangliahost_1:,yourgangliahost_2:

mrappmaster.sink.ganglia.servers=nna:

jobhistoryserver.sink.ganglia.servers=nna:

　　这里修改的是NameNode节点的内容，若是修改DataNode节点信息，内容如下所示：

#namenode.sink.ganglia.servers=nna:

datanode.sink.ganglia.servers=dn1:

#resourcemanager.sink.ganglia.servers=nna:

nodemanager.sink.ganglia.servers=dn1:

#mrappmaster.sink.ganglia.servers=nna:

#jobhistoryserver.sink.ganglia.servers=nna:

　　其他DN节点可以以此作为参考来进行修改。

　　另外，在配置完成后，若之前Hadoop集群是运行的，这里需要重启集群服务。

5.启动、预览Ganglia

　　Ganglia的启动命令有start、restart以及stop，这里我们分别在各个节点启动相应的服务，各个节点需要启动的服务如下：

NNA节点：

[hadoop@nna ~]$ service gmetad start

[hadoop@nna ~]$ service gmond start

[hadoop@nna ~]$ service httpd start

NNS节点：

[hadoop@nns ~]$ service gmond start

DN1节点：

[hadoop@dn1 ~]$ service gmond start

DN2节点：

[hadoop@dn2 ~]$ service gmond start

DN3节点：

[hadoop@dn3 ~]$ service gmond start

　　然后，到这里Ganglia的相关服务就启动完毕了，下面给大家附上Ganglia监控的运行截图，如下所示：

6.总结

　　在安装Hadoop监控工具Ganglia时，需要在安装的时候注意一些问题，比如：系统环境的依赖，由于Ganglia需要依赖一些安装包，在安装之前把依赖环境准备好，另外在配置Ganglia的时候需要格外注意，理解Ganglia的架构很重要，这有助于我们在Hadoop集群上去部署相关的Ganglia服务，同时，在配置Hadoop安装包的配置文件下（/etc/hadoop）目录下，配置Ganglia配置文件。将hadoop-metrics2.properties配置文件集成到Hadoop集群中去。

7.结束语

　　这篇博客就和大家分享到这里，如果大家在研究学习的过程当中有什么问题，可以加群进行讨论或发送邮件给我，我会尽我所能为您解答，与君共勉！

高可用Hadoop平台－Ganglia安装部署的更多相关文章

高可用Hadoop平台－Hue In Hadoop
1.概述前面一篇博客<高可用Hadoop平台-Ganglia安装部署>,为大家介绍了Ganglia在Hadoop中的集成,今天为大家介绍另一款工具——Hue,该工具功能比较丰富,下面是今 ...
高可用Hadoop平台－探索
1.概述上篇<高可用Hadoop平台-启航>博客已经让我们初步了解了Hadoop平台:接下来,我们对Hadoop做进一步的探索,一步一步的揭开Hadoop的神秘面纱.下面,我们开始赘述今 ...
高可用Hadoop平台－实战尾声篇
1.概述今天这篇博客就是<高可用Hadoop平台>的尾声篇了,从搭建安装到入门运行 Hadoop 版的 HelloWorld(WordCount 可以称的上是 Hadoop 版的 Hel ...
高可用Hadoop平台－实战
1.概述今天继续<高可用的Hadoop平台>系列,今天开始进行小规模的实战下,前面的准备工作完成后,基本用于统计数据的平台都拥有了,关于导出统计结果的文章留到后面赘述.今天要和大家分享的 ...
高可用Hadoop平台－集成Hive HAProxy
1.概述这篇博客是接着<高可用Hadoop平台>系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具,下面我打算 ...
高可用Hadoop平台－启航
1.概述在上篇博客中,我们搭建了<配置高可用Hadoop平台>,接下来我们就可以驾着Hadoop这艘巨轮在大数据的海洋中遨游了.工欲善其事,必先利其器.是的,没错:我们开发需要有开发工具 ...
高可用Hadoop平台－Oozie工作流之Hadoop调度
1.概述在<高可用Hadoop平台-Oozie工作流>一篇中,给大家分享了如何去单一的集成Oozie这样一个插件.今天为大家介绍如何去使用Oozie创建相关工作流运行与Hadoop上,已 ...
高可用Hadoop平台－Flume NG实战图解篇
1.概述今天补充一篇关于Flume的博客,前面在讲解高可用的Hadoop平台的时候遗漏了这篇,本篇博客为大家讲述以下内容: Flume NG简述单点Flume NG搭建.运行高可用Flume N ...
高可用Hadoop平台－应用JAR部署
1.概述今天在观察集群时,发现NN节点的负载过高,虽然对NN节点的资源进行了调整,同时对NN节点上的应用程序进行重新打包调整,负载问题暂时得到缓解.但是,我想了想,这样也不是长久之计.通过这个问题, ...

随机推荐

优秀的 Spring Cloud 开源软件
Spring Cloud是一系列框架的有序集合.它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册.配置中心.消息总线.负载均衡.断路器.数据监控等,都可以用 ...
互联网公司的面试官是如何360°无死角考察候选人的？[z]
[z]https://juejin.im/post/5c0e47ebf265da614e2be9a7 一.写在前面最近收到不少读者反馈,说自己在应聘一些中大型互联网公司的Java工程师岗位时遇到了不 ...
atom编辑器使用“apm install”无法响应的解决方案
工具:shadowsocks 利用ss建立代理服务,之后apm --help,得到apm的配置命令: apm - Atom Package Manager powered by https://ato ...
Linux学习---GCC编译常见错误
预处理错误: No such file or directory 出错原因:①包含错误:eg #include <abc.h> //abc.h为用户自行编写文件解决方法:⑴应改为#in ...
MUI 里js动态添加数字输入框后，增加、减少按钮无效
numbox 的自动初化是在 mui.ready 时完成的mui 页面默认会自动初始化页面中的所有数字输入框,动态构造的 DOM 需要进行手动初始化.比如:您动态创建了一个 ID 为 abc 的数字输 ...
走进JDK(六)------ArrayList
对于广大java程序员来说,ArrayList的使用是非常广泛的,但是发现很多工作了好几年的程序员不知道底层是啥...这我觉得对于以后的发展是非常不利的,因为java中的每种数据结构的设计都是非常完善 ...
Hdp安装问题杂解
5.在安装的时候遇到的问题 5.1使用ambari-server start的时候出现ERROR: Exiting with exit code -1. 5.1.1REASON: Ambari Ser ...
秒杀系统-DAO
DAO(Data Access Object) 数据访问对象首先需要创建秒杀库存表和秒杀成功明细表,如下所示: CREATE DATABASE seckill; use seckill; CREAT ...
Android Studio中的大量findViewById
一. 分析在Android Studio中开发时,findViewById是用的最多的函数之一.经常需要对返回的view进行类型转换,输入麻烦.代码丑陋. 本文提供两种方案来解决这个问题: 1.安装 ...
linq转载
在说LINQ之前必须先说说几个重要的C#语言特性一:与LINQ有关的语言特性 1.隐式类型 (1)源起在隐式类型出现之前, 我们在声明一个变量的时候, 总是要为一个变量指定他的类型甚至在fore ...

高可用Hadoop平台－Ganglia安装部署

1.概述

2.Ganglia背景

3.Ganglia安装部署、配置

3.1安装

3.2部署

3.3配置

4.Hadoop集群配置Ganglia

5.启动、预览Ganglia

6.总结

7.结束语

高可用Hadoop平台－Ganglia安装部署的更多相关文章

随机推荐

热门专题