https://book.open-falcon.org/zh_0_2/

本文档记录了CentOS7.4下open-falcon-v2监控系统的部署流程,以及一些需要注意的地方。

环境准备

安装Redis

0.InstallRedis3.2.sh  redis-3.2.3.tar.gz

安装mysql

将root让全部访问设置为%,将/tmp/mysql.sock链接到/app/mysqldata/3306/mysql.sock,将参数bind_address=127.0.0.1

初始化MySQL表结构

cd /tmp/ && git clone git://github.com/open-falcon/falcon-plus.git

cd /tmp/falcon-plus/scripts/mysql/db_schema/

mysql -h 127.0.0.1 -uroot -pmsds007 < 1_uic-db-schema.sql

mysql -h 127.0.0.1 -uroot -pmsds007 < 2_portal-db-schema.sql

mysql -h 127.0.0.1 -uroot -pmsds007 < 3_dashboard-db-schema.sql

mysql -h 127.0.0.1 -uroot -pmsds007 < 4_graph-db-schema.sql

mysql -h 127.0.0.1 -uroot -pmsds007 < 5_alarms-db-schema.sql

rm -rf /tmp/falcon-plus/

启动后端

open-falcon-v0.2.1.tar.gz 二进制包

创建工作目录

export FALCON_HOME=/home/work

export WORKSPACE=$FALCON_HOME/open-falcon

mkdir -p $WORKSPACE

解压二进制包

tar -xzvf open-falcon-v0.2.1.tar.gz -C $WORKSPACE

在一台机器上启动所有的后端组件

修改配置文件,确认配置文件中数据库账号密码与实际相同

# cd $WORKSPACE

# grep -Ilr 3306  ./

./nodata/config/cfg.json

./graph/config/cfg.json

./hbs/config/cfg.json

./alarm/config/cfg.json

./aggregator/config/cfg.json

./api/config/cfg.json

部分模块依赖连接数据库,需要修改配置文件

vim /home/work/open-falcon/aggregator/config/cfg.json

vim /home/work/open-falcon/graph/config/cfg.json

vim /home/work/open-falcon/hbs/config/cfg.json

vim /home/work/open-falcon/nodata/config/cfg.json

vim /home/work/open-falcon/api/config/cfg.json

vim /home/work/open-falcon/alarm/config/cfg.json

启动

cd $WORKSPACE

./open-falcon start

# 检查所有模块的启动状况

./open-falcon check

falcon-graph         UP            3962

falcon-hbs         UP            3970

falcon-judge         UP            3978

falcon-transfer         UP            3984

falcon-nodata         UP            3990

falcon-aggregator         UP            3996

falcon-agent         UP            4003

falcon-gateway         UP            4009

falcon-api         UP            4016

falcon-alarm         UP            4024

安装前端

python2.7安装pip

# unzip setuptools-38.5.1.zip

# cd setuptools-38.5.1

# python setup.py install

# tar -zxvf pip-9.0.1.tar.gz

# cd pip-9.0.1

# python setup.py install

克隆前端组件代码

cd $WORKSPACE

git clone git://github.com/open-falcon/dashboard.git

安装依赖包

yum install -y python-virtualenv

yum install -y python-devel

yum install -y openldap-devel

yum install -y mysql-devel

yum groupinstall "Development tools" -y

cd $WORKSPACE/dashboard/

virtualenv ./env

pip install -r pip_requirements.txt

ln -s /usr/local/mysql/lib/libmysqlclient.so.20 /usr/lib64/libmysqlclient.so.20

MySQL-python-1.2.5.zip会用到

修改配置

dashboard的配置文件为: '/home/work/open-falcon/dashboard/rrd/config.py',请根据实际情况修改

## API_ADDR 表示后端api组件的地址

API_ADDR = "http://127.0.0.1:8080/api/v1"

## 根据实际情况,修改PORTAL_DB_*, 默认用户名为root,默认密码为""

## 根据实际情况,修改ALARM_DB_*, 默认用户名为root,默认密码为""

在生产环境启动

bash control start

bash control tail

http://127.0.0.1:8081

系统初始化

前端用户需要注册,第一个注册的root账户就是管理员,所以第一件事就是先注册root用户密码123456

注册完root用户,最好把注册功能关闭,可以通过root创建其他用户。需要修改api模块的配置文件,signup_disable改为true就可以了

部署agent

将agent目录复制到要监控的主机上

scp -r /home/work/open-falcon/agent/ mydb2:/home/work/open-falcon

scp -r /home/work/open-falcon/agent/ mydb3:/home/work/open-falcon

将open-falcon复制到要监控的主机上

scp /home/work/open-falcon/open-falcon mydb2:/home/work/open-falcon

scp /home/work/open-falcon/open-falcon mydb3:/home/work/open-falcon

编辑配置文件

# cat cfg.json

{

"debug": true,

"hostname": "mydb2",

"ip": "192.168.1.102",

"plugin": {

"enabled": false,

"dir": "./plugin",

"git": "https://github.com/open-falcon/plugin.git",

"logs": "./logs"

},

"heartbeat": {

"enabled": true,

"addr": "192.168.1.101:6030",

"interval": 60,

"timeout": 1000

},

"transfer": {

"enabled": true,

"addrs": [

"192.168.1.101:8433"

],

"interval": 60,

"timeout": 1000

},

"http": {

"enabled": true,

"listen": ":1988",

"backdoor": false

},

"collector": {

"ifacePrefix": ["eth", "em"],

"mountPoint": []

},

"default_tags": {

},

"ignore": {

"cpu.busy": true,

"df.bytes.free": true,

"df.bytes.total": true,

"df.bytes.used": true,

"df.bytes.used.percent": true,

"df.inodes.total": true,

"df.inodes.free": true,

"df.inodes.used": true,

"df.inodes.used.percent": true,

"mem.memtotal": true,

"mem.memused": true,

"mem.memused.percent": true,

"mem.memfree": true,

"mem.swaptotal": true,

"mem.swapused": true,

"mem.swapfree": true

}

}

/home/work/open-falcon/open-falcon start agent  启动进程

/home/work/open-falcon/open-falcon stop agent  停止进程

/home/work/open-falcon/open-falcon monitor agent  查看日志

mydb1是单MySQL

mydb2,mydb3是复制

监控MySQL

# tar -zxvf mymon.tar.gz

修改配置文件

# cat mon.cfg

[default]

log_file=/soft/mymon.log

# Panic 0

# Fatal 1

# Error 2

# Warn 3

# Info 4

# Debug 5

log_level=5

falcon_client=http://127.0.0.1:1988/v1/push

#自定义endpoint

endpoint=mydb2

[mysql]

user=root

password=msds007

host=127.0.0.1

port=3306

# cat slavestatus.sh

#!/bin/bash

source /etc/profile

ts=`date +%s`;

MySql_CMD="/usr/local/mysql/bin/mysql"

User=root

passwd=msds007

LogLevel="error"

#LogLevel="debug"

Endpoint=`hostname`

Port=3306

Slave_IO_Metric="Slave_IO_Status"

Slave_SQL_Metric="Slave_SQL_Status"

Normal_Value=1

NonNormal_Value=0

CurrentPath=$(dirname $0)

Logfile=$CurrentPath/out.log

#Ip_Address=`ifconfig -a|grep "inet addr"|grep 10|awk '{print $2}'|cut -d : -f 2`

Ip_Address=127.0.0.1

IOSTATUS=`$MySql_CMD -u$User -p$passwd -S /app/mysqldata/3306/mysql.sock -e "show slave status \G "|grep Slave_IO_Running|cut -d ':' -f 2|sed -e 's/ //g'`

SQLSTATUS=`$MySql_CMD -u$User -p$passwd -S /app/mysqldata/3306/mysql.sock -e "show slave status \G "|grep Slave_SQL_Running:|cut -d ':' -f 2|sed -e 's/ //g'`

echo $IOSTATUS

echo $SQLSTATUS

if [ "$LogLevel" == "debug" ]; then

if [ "$IOSTATUS" == ""Yes ]; then

echo "curl -X POST -d "[{\"metric\": \"$Slave_IO_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $Normal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push" >> $Logfile

else

echo "curl -X POST -d "[{\"metric\": \"$Slave_IO_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $NonNormal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push" >> $Logfile

fi

if [ "$SQLSTATUS" == ""Yes ]; then

echo "curl -X POST -d "[{\"metric\": \"$Slave_SQL_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $Normal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push" >> $Logfile

else

echo "curl -X POST -d "[{\"metric\": \"$Slave_SQL_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $NonNormal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push" >> $Logfile

fi

else

if [ "$IOSTATUS" == ""Yes ]; then

curl -X POST -d "[{\"metric\": \"$Slave_IO_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $Normal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push

else

curl -X POST -d "[{\"metric\": \"$Slave_IO_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $NonNormal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push

fi

if [ "$SQLSTATUS" == ""Yes ]; then

curl -X POST -d "[{\"metric\": \"$Slave_SQL_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $Normal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push

else

curl -X POST -d "[{\"metric\": \"$Slave_SQL_Metric\", \"endpoint\": \"$Endpoint\", \"timestamp\": $ts,\"step\": 60,\"value\": $NonNormal_Value,\"counterType\": \"GAUGE\",\"tags\": \"port=$Port\"}]" http://$Ip_Address:1988/v1/push

fi

fi

crontab中

* * * * * /soft/mymon -c /soft/etc/mon.cfg

* * * * * sh /soft/etc/slavestatus.sh

添加模板,添加主机组,添加screen

模板

主机组

Screen->Graph部分

Com_delete/port=3309

Com_insert/port=3309

Com_select/port=3309

Com_update/port=3309

Innodb_row_lock_current_waits/port=3309

Innodb_row_lock_time/port=3309

Innodb_row_lock_time_avg/port=3309

Innodb_row_lock_time_max/port=3309

Innodb_row_lock_waits/port=3309

Innodb_rows_deleted/port=3309

Innodb_rows_inserted/port=3309

Innodb_rows_updated/port=3309

Queries/port=3309

Questions/port=3309

Seconds_Behind_Master/port=3309

Slave_IO_Status/port=3309

Slave_SQL_Status/port=3309

Slow_queries/port=3309

Threads_connected/port=3309

Threads_running/port=3309

cpu.idle

disk.io.read_bytes/device=sdb

disk.io.read_requests/device=sdb

disk.io.util/device=sdb

disk.io.write_bytes/device=sdb

disk.io.write_requests/device=sdb

innodb_autoinc_lock_mode/port=3309

innodb_lock_wait_timeout/port=3309

mem.memfree.percent

mem.swapfree.percent

mem.swapused.percent

Innodb_row_lock_current_waits:当前正在等待锁定的数量;

Innodb_row_lock_time :从系统启动到现在锁定的总时间长度,单位ms;

Innodb_row_lock_time_avg :每次等待所花平均时间;

Innodb_row_lock_time_max:从系统启动到现在等待最长的一次所花的时间;

Innodb_row_lock_waits :从系统启动到现在总共等待的次数

监控Redis

下载相关脚本

测试运行

根据实际部署情况,修改有注释位置附近的配置

测试: python redis-monitor.py

将脚本加入crontab执行即可

* * * * * /usr/bin/python /soft/redis-monitor.py

注意redis-cli全路径,修改redis-monitor.py

注意redis.conf全路径,修改redis-monitor.py

启动redis

/usr/local/redis/bin/redis-server /etc/redis/6379.conf

监控MongoDB

Python 2.6

PyYAML > 3.10

python-requests > 0.11

pip install pyyaml

pip install requests

pip install pymongo

解压目录到/soft/mongomon

配置当前服务器的MongoDB多实例(mongod,配置节点,mongos)信息,/soft/mongomon/conf/mongomon.conf 每行记录一个实例: 端口,用户名,密码

{port: 27017, user: "root",password: "abc123"}

配置crontab, 修改mongomon/conf/mongomon_cron文件中mongomon安装path; cp mongomon_cron /etc/cron.d/

几分钟后,可从open-falcon的dashboard中查看MongoDB metric

endpoint默认是hostname

启动MongoDB

/usr/local/mongodb/bin/mongod -f /app/mongodb/27017/mongodb.config

Open-falcon监控的更多相关文章

  1. falcon监控指标

    mysql监控指标: 流量状态: Bytes_received/s #平均每秒从所有客户端接收到的字节数,单位KB Bytes_sent/s #平均每秒发送给所有客户端的字节数,单位KB

  2. [转]彻底征服 Spring AOP 之 实战篇

    Spring AOP 实战 看了上面这么多的理论知识, 不知道大家有没有觉得枯燥哈. 不过不要急, 俗话说理论是实践的基础, 对 Spring AOP 有了基本的理论认识后, 我们来看一下下面几个具体 ...

  3. 161110、彻底征服 Spring AOP 之 实战篇

    Spring AOP 实战 看了上面这么多的理论知识, 不知道大家有没有觉得枯燥哈. 不过不要急, 俗话说理论是实践的基础, 对 Spring AOP 有了基本的理论认识后, 我们来看一下下面几个具体 ...

  4. 彻底征服 Spring AOP 之 实战篇

      Spring AOP 实战 看了上面这么多的理论知识, 不知道大家有没有觉得枯燥哈. 不过不要急, 俗话说理论是实践的基础, 对 Spring AOP 有了基本的理论认识后, 我们来看一下下面几个 ...

  5. python open-falcon docker.WEB developers---flask,---django.

    http://www.verydemo.com/demo_c281_i2477.html (python Gevent – 高性能的Python并发框架) http://www.django-rest ...

  6. ELK初步指南

    ELK的简单科普文章,加入了自己的一些理解. 内容包括ELK的基本介绍, 应用场景, 架构设计, 监控及自监控, 业界进展及推荐资料等. 用户故事 场景一 作为一个运维工程师, 某天虚拟机出现故障, ...

  7. Spring AOP 实战运用

    Spring AOP 实战 看了上面这么多的理论知识, 不知道大家有没有觉得枯燥哈. 不过不要急, 俗话说理论是实践的基础, 对 Spring AOP 有了基本的理论认识后, 我们来看一下下面几个具体 ...

  8. Hive SQL 监控系统 - Hive Falcon

    1.概述 在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务.在编写 Hive SQ ...

  9. Linux记录-JMX监控Tomcat上传到falcon

    1.登录测试服务器xxxxxx xxxxxx su root输入xxxx 2.先修改Tomcat的启动脚本,(linux下为catalina.sh),添加以下内容: CATALINA_OPTS=&qu ...

  10. IT运维监控解决方案介绍

    现状 •小公司/ 创业团队< 500台服务器规模 开源方案:Zabbix.Nagios.Cacti- 云服务提供商:监控宝.oneAlert等 •BAT级别> 10万台服务器 投 ...

随机推荐

  1. 无法连接虚拟设备 ide1:0及上不网

    无法连接虚拟设备 ide1:0 问题: 启动vmware之后,发现出现无法连接 ide 1:0. 网络查找之后,发现是之前挂载的iso镜像找不到了. 原因: 我把iso镜像放到其他位置. 解决: 指定 ...

  2. 丰桥运单打印windows/linux环境安装(原)

    Linux ①linux下安装jdk1.8,执行命令:yum -y install java ②创建文件夹sf-service将csim_waybill_print_service_V1.0.3.ja ...

  3. iOS学习之Autolayout

    转载自:http://vit0.com/blog/2013/12/07/iosxue-xi-zhi-autolayout/ 学习资料 文章 Beginning Auto Layout Tutorial ...

  4. Linux如何修改环境变量

    如果想要环境变量永久生效可以修改下面两个文件中的任何一个: 1 /etc/profile 2 .bash_profile 其中,/etc/profile是全局的环境变量,对所有用户生效,而.bash_ ...

  5. XGBoost原理简介

    XGBoost是GBDT的改进和重要实现,主要在于: 提出稀疏感知(sparsity-aware)算法. 加权分位数快速近似学习算法. 缓存访问模式,数据压缩和分片上的实现上的改进. 加入了Shrin ...

  6. ios-Realm数据库的使用

    [集成 Realm] 本 Demo 使用 OC 创建,所以先进入 Realm 官网 (我记得之前都是有官方中文教程的,但现在最新版没有中文了),到 Objective-C -> Getting ...

  7. react封装基于axios的API请求

    一.最近做的一个后台管理项目,基于antd-pro做的,需要封装基于axios请求,便于开发,直接上代码. import axios from 'axios'; export const Method ...

  8. Python3+RobotFramewok 快速入门(二)

    1. 原理 首先解释一下RF的工作原理,官方文档介绍就不赘述了,笔者就框架架构做出一个更加具体的描述 测试套及测试用例集(Test Data即需要用户编写的脚本)通过RF特定的语法解析,然后知道用户要 ...

  9. java文件夹上传

    我们平时经常做的是上传文件,上传文件夹与上传文件类似,但也有一些不同之处,这次做了上传文件夹就记录下以备后用. 首先我们需要了解的是上传文件三要素: 1.表单提交方式:post (get方式提交有大小 ...

  10. R语言与概率统计(五) 聚类分析

    #########################################0808聚类分析 X<-data.frame( x1=c(2959.19, 2459.77, 1495.63, ...