使用目的? 在公司项目中需要做一个日志监控,最开始选择的是efk,但是efk的资料相对较少并且之前对这几个产品都没接触过,使用起来难度.于是选择了zabbix作为项目的运维监控系统. zabbix能做什么? zabbix主要是用来网络监控.系统监控.应用监控等场景.zabbix分为server端和agent端,文章前半部分都是在讲server端的安装操作,后面结尾讲解agent的安装操作. 搭建环境 centos7.0,lnmp集成环境(mysql5.7,php7.2),zabbix4.0版本.…
一.Open-Falcon介绍 1.监控系统,可以从运营级别(基本配置即可),以及应用级别(二次开发,通过端口进行日志上报),对服务器.操作系统.中间件.应用进行全面的监控,及报警,对我们的系统正常运行的作用非常重要. 2.基础监控 CPU.Load.内存.磁盘.IO.网络相关.内核参数.ss 统计输出.端口采集.核心服务的进程存活信息采集.关键业务进程资源消耗.NTP offset采集.DNS解析采集,这些指标,都是open-falcon的agent组件直接支持的. Linux运维基础采集项:…
前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展,机器越来越多,应用越来越多,服务越来越微,应用运行基础环境越来多样化,容器.虚拟机.物理机不一而足.面对动辄几百上千个虚拟机.容器,数十种要监控的对象,现有的监控系统还能否支撑的住?来自于容器.虚拟机.物理机.网络设备.中间件的指标数据如何采用同一套方案快速.完整的收集和分析告警?怎样的架构.技术方案才更适合如此庞大繁杂的监控需求呢? 上篇文章<建设DevOps统一运维监控平台,先从日志监控说起>主要从日志监控的方面进行了…
优化系统资源ulimit<高性能Linux服务器构建实战:运维监控.性能调优与集群应用> 假设有这样一种情况,一台Linux 主机上同时登录了10个用户,在没有限制系统资源的情况下,这10个用户同时打开了500个文档,而每个文档的大小为10MB,这时系统的内存资源就会受到巨大的挑战.如果没有内存方面的限制,势必造成系统资源利用的混乱.而实际的应用环境要比这种假设复杂得多.这时,ulimit就派上用场了.ulimit是一种简单并且有效的实现资源限制的方式. ulimit可以限制系统的各个方面,它…
优化Linux内核参数/etc/sysctl.conf  sysctl  <高性能Linux服务器构建实战:运维监控.性能调优与集群应用> http://book.51cto.com/art/201202/314880.htm 2.6 Varnish优化 Varnish是否能稳定.快速地运行,与Linux本身的优化及Varnish自身参数的设置有很大关系.在安装配置完Varnish后,还必须从操作系统和Varnish配置参数两个方面对Varnish服务器进行性能优化,从而最大限度地发挥Varn…
CentOS下搭建Nagios 王尚 2014.11.09 操作系统:CentOS-6.5-i386-bin-DVD1.iso 安装在VM中进行测试的. 本章需要的软件链接: php-5.3.2.tar.gz http://www.163disk.com/fileview_2161669.html nagios-plugins-1.4.14.tar.gz http://www.163disk.com/fileview_2161667.html nagios-cn-3.2.3.tar.bz2 ht…
运维监控-基于yum的方式部署Zabbix Server 4.0 版本 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.如何选择zabbix版本 1>.打开zabbix官方网址(https://www.zabbix.com/) 2>.查看zabbix版本的生命周期(https://www.zabbix.com/life_cycle_and_release_policy) 如下图所示,如果还在使用zabbix2.2版本的小伙伴应该尽量往zabbix3.0 LTS或者zabb…
运维监控-Open-Falcon介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Open-Falcon 介绍 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题.监控系统作为一个成熟的运维产品,业界有很多开源的实现可供选择.当公司刚刚起步,业务规模较小,运维团队也刚刚建立的初期,选择一款开源的监控系统,是一个省时省力,效率最高的方案.之后,随着业务规模的持续快速增长,监控的对象也越来越多,越来越复杂,监…
 概述 应用上线后,运维工作才刚开始,具体工作可能包括:升级版本上线工作.服务监控.应用状态统计.日常服务状态巡检.突发故障处理.服务日常变更调整.集群管理.服务性能评估优化.数据库管理优化.随着应用PV增减进行应用架构的伸缩.安全.运维开发工作. 今天重点介绍运维流程管理.运维发布变更.运维监控告警三个方面所需要的工具. 一.运维流程管理工具 1.发布变更流程管理工具 做为系统接口与其他角色的工作衔接.并提供审批环节控制发布变更的风险.流程管理工具并不负责具体的业务操作的执行,只是作为单据系统…
概述:Telegraf收集信息,influxdb时序数据库存储数据,grafana平台展示数据,并进行监控告警,组成一个自动化运维监控平台. 一.influxdb ​ InfluxDB是一个由InfluxData开发的开源时序型数据.它由Go写成,着力于高性能地查询与存储时序型数据.InfluxDB被广泛应用于存储系统的监控数据,IoT行业的实时数据等场景. 1. 三大特性 时序性(Time Series):与时间相关的函数的灵活使用(诸如最大.最小.求和等): 度量(Metrics):对实时大…