一.介绍
        Ganglia是由UC Berkeley发起的一个开源监控项目,设计用于监控数以千几的节点。每台服务器都运行一个收集和发送监控数据名为gmond的守护进程。它将从操作系统和指定主机中收集。接收所有监控数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次架构模式,使ganglia可以实现良好的扩展。Gmond带来的系统负载非常小,这使得它成为集群中各个服务器上运行一段代码而不会影响用户性能。

Ganglia主要用来监控系统性能的软件,通过曲线很容易见到每个节点的工作状态,对合理调整,分配系统资源,提高系统整体性能起到重要作用,支持浏览器方式访问,但不能监控节点硬件技术指标。Ganglia是分布式的监控系统。

Ganglia的组件:
    Ganglia包括如下程序,它们之间通过xml格式传递监控数据。
        服务端ganglia meta daemon(gmetad):负责收集各个cluster的数据,并更新到rrd数据库中
        客户端ganglia monitoring daemon(gmond):收集本机的监控数据,发送到其他服务器上,收集其他服务器的监控数据,供gmetad读取。
基于web的动态访问方式ganglia PHP web Frontend:一个基于web的监控界面,需要和gmetad安装在同一个节点上,从gmetad取数据,并且读取rrd数据库,生成图片显示。

Ganglia工作模式:
        Ganglia收集数据可以工作在单播或多播模式下,默认为多播模式
单播:发送自己收集到的监控数据到特定的一台或几台服务器上,可以跨网段。
多播:发送自己收集到的监控数据到同一网段所有的服务器上,同时收集同一网段的所有服务器发送过来的监控数据。因为是以广播包的形式发送,因此需要在同一网段内,但同一网段内,又可以定义不同的发送通道。

二。ganglia的安装和配置:

1.直接使用epelyum源进行安装即可,或者编译安装

1.1 安装所需软件包:

yum install  -y rrdtool rrdtool-devel apr-devel expat-devel dejavu-lgc-sans-mono-fonts dejavu-sans-mono-fonts glibc glibc-common apr apr-devel apr-util expat expat-devel  pcre pcre-devel  zlib zlib-devel

1.2 安装confuse

wget http://ftp.twaren.net/Unix/NonGNU//confuse/confuse-2.7.tar.gz
tar -zxf confuse-2.7.tar.gz
cd confuse-2.7
./configure CFLAGS=-fPIC --disable-nls
make && make install

1.3 设置python 模块的环境变量

echo "/usr/local/lib" /etc/ld.so.conf
ldconfig
ldconfig -v |grep "python"

1.4 安装ganglia 服务端 gmetad

 
wget http://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.1/ganglia-3.7.1.tar.gz
tar zxf ganglia-3.7.1.tar.gz
cd ganglia-3.7.1
./configure --prefix=/usr/local/ganglia --with-gmetad --enable-gexec
make
make install

1.5 安装ganglia的agent端

wget http://jaist.dl.sourceforge.net/project/ganglia/ganglia%20monitoring%20core/3.7.1/ganglia-3.7.1.tar.gz
tar zxf ganglia-3.7.1.tar.gz
cd ganglia-3.7.1
./configure --prefix=/usr/local/ganglia  --enable-gexec
make
make install

1.6 安装ganglia-web 前端展示

2. 配置ganglia gmetad端

2.1 复制服务控制脚本

cp -fr ganglia/gmetad/gmetad.init /etc/init.d/gmetad

并修改脚本下面内容

GMETAD=/usr/local/ganglia/sbin/gmetad

2.2 修改gmetad的配置文件更改下面参数:(参数的具体含义请参考gmetad.conf配置文件解释)

data_source "my cluster" 10.10.211.6
setuid_username "nobody"
xml_port 8651
interactive_port 8652
rrd_rootdir “/var/lib/ganglia/rrds”
case_sensitive_hostnames 0

创建rrd_rootdir文件,并授权nobody

mkdir /var/lib/ganglia/rrds
chown -R nobody.nobody /var/lib/ganglia/rrds

2.3 启动gmetad 服务,检查服务端口和进程

[root@puppet.sa.beyond.com ~]#/etc/init.d/gmetad start
Starting GANGLIA gmetad:                                   [确定]
[root@puppet.sa.beyond.com ~]#netstat -lnpt | grep gmetad
tcp        0      0 0.0.0.0:8651                0.0.0.0:*                   LISTEN      4529/gmetad
tcp        0      0 0.0.0.0:8652                0.0.0.0:*                   LISTEN      4529/gmetad
[root@puppet.sa.beyond.com ~]#ps -ef | grep gmetad
nobody    4529     1  0 23:38 ?        00:00:00 /usr/local/ganglia/sbin/gmetad
root      4545 20744  0 23:38 pts/3    00:00:00 grep gmetad

3.配置ganglia gmond 端

globals {
 daemonize = yes        #以后台的方式运行
 setuid = yes
 user = nobody          #运行gmond的用户
 debug_level = 0        #调试级别
 max_udp_msg_len = 1472
 mute = no            #哑巴,本节点将不会再广播任何自己收集到的数据到网络上
 deaf = no             #聋子,本节点将不再接收任何其他节点广播的数据包
 allow_extra_data = yes
 host_dmax = 0 /*secs */
 cleanup_threshold = 300 /*secs */
 gexec = no             #是否使用gexec
 send_metadata_interval = 0
} cluster {
 name = "Cluster1"     #本节点属于哪个cluster
 owner = "junfeng"     #谁是该节点的所有者
 latlong = "unspecified"   #在地球上的坐标,经度、纬度?
 url = "unspecified"
} host {
 location = "unspecified"  
} udp_send_channel {       #udp包的发送通道
 mcast_join = 239.2.11.71   #多播,工作在239.2.11.71通道下。如果使用单播模式,则要写host = host1,单播模式下也可以配置多个udp_send_channel
 port = 8649            #监听端口
 ttl = 1
} udp_recv_channel {           #接收udp包配置
 mcast_join = 239.2.11.71   #同样工作在239.2.11.71通道下
 port = 8649                #监听端口
 bind = 239.2.11.71         #绑定
} tcp_accept_channel {
 port = 8649               #通过tcp协议监听的端口,远端可以通过链接8649端口得到监控数据
}

4.配置gmond web

gmond-web 是用php写的,所以需要web+php进行解析

4.1 下载软件包

wget http://heanet.dl.sourceforge.net/project/ganglia/ganglia-web/3.5.10/ganglia-web-3.5.10.tar.gz

4.2 配置

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

 
 
 
 

ganglia分布式监控部署的更多相关文章

  1. zabbix分布式监控部署--技术流ken

    前言 zabbix proxy可以代替zabbix server检索客户端的数据,然后把数据汇报给zabbix server,并且在一定程度上分担了zabbix server的压力.zabbix pr ...

  2. zabbix proxy分布式监控部署

    一.proxy分布式监控介绍 来源于zabbix官网: https://www.zabbix.com/documentation/3.4/zh/manual/distributed_monitorin ...

  3. 017-zabbix_proxy分布式监控部署

    一.proxy分布式监控介绍 来源于zabbix官网: https://www.zabbix.com/documentation/3.4/zh/manual/distributed_monitorin ...

  4. 分布式监控数据采集系统Ganglia实战

    一.什么是Ganglia 对于这个工具,大家可能比较陌生,但是它功能非常强大,如果我们想收集所有服务器.网络设备的数据,那么ganglia绝对是首选,在深入学习之前,还是先从基础概念了解起吧! Gan ...

  5. zabbix分布式监控的部署与win被控端

    zabbix是一个分布式监视,管理系统,基于server-clinet架构,可用于监视各种网络服务,服务器和网络机器等状态. server端基于C语言,web管理端Frontend则是基于PHPA制作 ...

  6. Ganglia+Nagios监控系统

    第1章 简介 ganglia是一款为HPC(高性能计算) 集群设计的可扩展性 的分布式监控系统,它可以监视和显示集群中节点的各种状态信息,他由运行在各个节点上的gmond守护进程来采集 CPU.内存. ...

  7. 大众点评开源分布式监控平台 CAT 深度剖析

    一.CAT介绍 CAT系统原型和理念来源于eBay的CAL的系统,CAT系统第一代设计者吴其敏在eBay工作长达十几年,对CAL系统有深刻的理解.CAT不仅增强了CAL系统核心模型,还添加了更丰富的报 ...

  8. zabbix监控-部署(一)

    zabbix之自动化监控-部署篇(一) 标签(空格分隔): linux 笔者Q:972581034 交流群:605799367.有任何疑问可与笔者或加群交流 浅谈监控 监控命令 查看硬件的温度/风扇转 ...

  9. NetCore实践篇:分布式监控客户端ZipkinTracer从入门到放弃之路

    前言 本文紧接上篇.Net架构篇:思考如何设计一款实用的分布式监控系统?,上篇仅仅是个思考篇,跟本文没有太大的关系.但有思考,结合现有的开源组件,实践起来更易理解起来,所以看本文之前,应该先看下上篇博 ...

随机推荐

  1. [原创]DevOps 的技术栈和工具

    [原创]DevOps 的技术栈和工具 版本控制:GitHub.GitLab.SubVersion 自动化构建和测试:Maven .Selenium.JMeter.Gradle 持续集成&交付: ...

  2. uva 10816 Travel in Desert(简单的好题~两种方法)

    题意: 给出 一个图 点与点之间的路径上有两个权值 路径长度和温度 要求在所走路径中的温度的最大值最小的前提下 走最短路径 解题思路1: 首先用 最小生成树 的方法走出 最小瓶颈路 .把在这期间用到的 ...

  3. Delphi创建ActiveX控件,实现安全接口及无界面代码

    Delphi创建OCX控件非常的方便,但IE调用时弹出的安全认证非常麻烦,有时OCX也不需要界面,IE调用时需要隐藏,非常不方便.在DELPHI中创建OCX实现安全接口和创建事件中修改部分代码 实现安 ...

  4. C#中使用 SendMessage 向非顶端窗体发送组合键

    开门见山,不废话了, 直接举例说明一下: 比如发送ALT + F 以下是 用spy++截取的消息内容 <00001> 000310DC P WM_SYSKEYDOWN nVirtKey:V ...

  5. Java知识回顾 (5)数组、日期与时间, StringBuffer和StringBuilder

    一.数组 数组对于每一门编程语言来说都是重要的数据结构之一,当然不同语言对数组的实现及处理也不尽相同. dataType[] arrayRefVar; // 首选的方法 或 dataType arra ...

  6. CAP:Alantany 谈 CAP

    引用Alantany的话:“CAP理论提出就是针对分布式数据库环境的,所以,P这个属性是必须具备的.P就是在分布式环境中,由于网络的问题可能导致某个节点和其它节点失去联系,这时候就形成了P(parti ...

  7. [Android Pro] AndroidX了解一下

    cp : https://blog.csdn.net/qq_17766199/article/details/81433706 1.说明 官方原文如下: We hope the division be ...

  8. vs2010编译错误(报错:LINK : fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏)

    报错:LINK : fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏 1> 这段时间忙于看文献,没用过VS了. 今天用着用着就报错了: LINK : fat ...

  9. MySQL垂直拆分和水平拆分的优缺点和共同点总结

    数据的拆分(Sharding)根据其拆分分规则的类型,可以分为两种拆分模式.一种是按照不同的表(或者Schema)来切分到不同的数据库(主机)之上,这种切可以称之为数据的垂直(纵向)拆分:另外一种则是 ...

  10. MDX Cookbook 02 - 除数为零的问题

    先直接看一个例子 - WITH MEMBER [Date].[Calendar Year].[CY 2006 vs 2005 Bad] AS ], FORMAT_STRING = 'Percent' ...