04-监控-手册(Runbook)】的更多相关文章

前言 好的手册在当警报触发时,便于快速定位问题.在更复杂的环境中,团队中的每个人都不会对每个系统都有所了解,而且Runbook是传播这些知识的一个载体,更是好方法. 手册 == RunBook, 请了解. 1.编写RunBook的注意事项 为特定服务编写了一个好的Runbook,大致需要一下几点: 这项服务是什么,它的作用是什么? 谁是项目负责? 它有什么依赖关系? 它的基础设施是什么样的? 它发出什么指标和日志,它们是什么意思? 为它设置了什么警报,为什么? 对于每个警报,我们可以包含指向该服…
1.系统监控器已经自带了默认的监控功能,包括CPU.内存.带宽.进程等,但带宽的一些详情不能显示出来. 2.使用top命令进行监控进程 sudo top 3.安装Indicator-sysmonitor软件在导航条上显示CPU.内存.带宽这些信息. 但是这些都只能是总的,不能显示详情. 个人建议不安装.因为这些功能本身系统就有了,还要增加多一个进程在系统,比较浪费资源. 具体配置参考:http://www.cnblogs.com/EasonJim/p/7130171.html 4.带宽详情监控工…
[编者按]本文作者为 John Matson,主要介绍 mysql 性能监控应该关注的 4 大指标. 文章系国内 ITOM 管理平台 OneAPM 编译呈现.    MySQL 是什么? MySQL 是现而今最流行的开源关系型数据库服务器.由 Oracle 所有,MySQL 提供了可以免费下载的社区版及包含更多特性与支持的商业版.从 1995 年首发以来,MySQL 衍生出多款备受瞩目的分支,诸如具有相当竞争力的 MariaDB 及 Percona. 关键 MySQL 统计指标 如果你的数据库运…
1.Linux监控概述       Linux服务器要保证系统的高可用性,需要实时了解到服务器的硬件.操作系统.应用服务等的运行状况,各项性能指标是否正常,需要使用各种LINUX命令.做到自动化运维就需要,将上述各项监控指标在同一个软件中展显出来,图形化监控,消息报警机制,日志检看,资产管理等等 2.Linux监控的对象 2.1 硬件监控 (1)服务器:如电源,风扇,磁盘,CPU等,可以使用IPMI监控,在LINUX下安装IPMITOOL 不同的服务器厂商都在服务器上配有远程控制卡BMC: 如D…
[编者按]本文作者为 John Matson,主要介绍 mysql 性能监控应该关注的4大指标. 第一部分将详细介绍前两个指标: 查询吞吐量与查询执行性能.文章系国内 ITOM 管理平台 OneAPM 编译呈现. MySQL 是什么? MySQL 是现而今最流行的开源关系型数据库服务器.由 Oracle 所有,MySQL 提供了可以免费下载的社区版及包含更多特性与支持的商业版.从1995年首发以来,MySQL 衍生出多款备受瞩目的分支,诸如具有相当竞争力的 MariaDB 及 Percona.…
(1)性能监控脚本 performance.sh #!/bin/bash #--------------------------------------------------------------------------------- # 说明,Linux服务器--性能监控脚本 ,网址来源:http://bbs.51cto.com/thread-937759-1.html # 主要监控: 01.监控cpu系统负载 02. 监控cpu使用率 03. 监控交换分区 04. 监控磁盘空间 # 生成…
pscp使用详解 Windows与Linux文件互传工具 pscp使用方法详解:pscp是putty安装包所带的远程文件传输工具,是一款十分常见windows与linux系统之间文件互传的工具,使用方法与linux中的scp相似,这里来介绍一些详细的使用方法. PSCP下载地址,版本:Release 0.60 ------------------------------------------分割线------------------------------------------ 免费下载地址…
本文为转载,原文见以下链接:https://mp.weixin.qq.com/s/4AMzq87V6eW3YPgE0mCdSw 1 基础篇 01 面向对象 → 什么是面向对象 面向对象.面向过程 面向对象的三大基本特征和五大基本原则 → 平台无关性 Java 如何实现的平台无关 JVM 还支持哪些语言(Kotlin.Groovy.JRuby.Jython.Scala) → 值传递 值传递.引用传递 为什么说 Java 中只有值传递 → 封装.继承.多态 什么是多态.方法重写与重载 Java 的继…
作者: 彭东林 邮箱: pengdonglin137@163.com QQ:   405728433 开发板:     tq2440 工具:       Win7 + VMware + Debian6 U-boot版本: u-boot-2015.01 Linux版本:  天嵌自带的 linux-2.6.30.4 GCC版本:     gcc version 4.3.3 (Sourcery G++ Lite 2009q1-176) 之前由于移植过u-boot-2014.04到tq2440上,现在移…
Java 工程师成神之路 | 2019正式版 原创: Hollis Hollis 2月18日 https://mp.weixin.qq.com/s/hlAn6NPR1w-MAwqghX1FPg http://www.hollischuang.com/   主要版本 更新时间 备注 v1.0 2015-08-01 首次发布 v1.1 2018-03-12 增加新技术知识.完善知识体系 v2.0 2019-02-19 结构调整,更适合从入门到精通:进一步完善知识体系: 新技术补充: 1 基础篇 01…
1.镜像网址:https://hub.docker.com/r/nacos/nacos-server 2.Clone project git clone --depth 1 https://github.com/nacos-group/nacos-docker.git cd nacos-docker 3.启动 Docker 4.Standalone Derby(启动 Nacos) docker-compose -f example/standalone-derby.yaml up 5.访问 Na…
Fordeal的数据平台调度系统之前是基于Azkaban进行二次开发的,但是在用户层面.技术层面都存在一些痛点问题难以被解决.比如在用户层面缺少任务可视化编辑界面.补数等必要功能,导致用户上手难体验差.在技术层面,架构过时,持续迭代难度大.基于这些情况,经过竞品对比和调研后,Fordeal数据平台新版系统决定基于Apache DolphinScheduler进行升级改造.那整个迁移过程中开发人员是如何让使用方平滑过渡到新系统,又做出了哪些努力呢? 5月 Apache Dolphinschedul…
参考来源: https://github.com/digoal/blog/blob/master/201803/20180326_01.md#postgresql-一主多从多副本强同步简明手册---配置压测监控切换防脑裂修复0丢失---珍藏级 PostgreSQL 一主多从(多副本,强同步)简明手册 - 配置.压测.监控.切换.防脑裂.修复.0丢失 - 珍藏级 作者 digoal 日期 2018-03-25 标签 PostgreSQL , 多副本 , 一主多从 , 流复制 背景 PostgreS…
Ubuntu_10.04下Hadoop-0.20.2集群配置手册 一.软硬件环境的准备 下面的文章来自hadoopor.com,我先交待一下我自己的环境: 两台机器,每台机器上面两个虚机(vmware 均以桥接方式,也就是说4个虚机都有各自独立的内网IP)都是ubuntu10.04,宿主机都是windowsxp,用SecureCRT(严重推荐,好使)连接各个副机.最后按下文配置,成功运行~另:机器之间的文件用SCP命令吧,好使~~~ ///////////////////////////////…
在掌握了前面几篇关于OMCS的详细介绍后,我们就可以正式基于OMCS进行二次开发了.下面我们就从服务端和客户端的角度分别介绍开发的步骤. 一.服务端开发 抛开具体的业务逻辑而言,就OMCS的服务端的开发而言相当简单.步骤如下所示: (1)下载  OMCS多媒体服务器(带源码). (2)使用VS打开OMCS.Server项目,修改其中的DefaultUserVerifier类的实现,为VerifyUser方法添加验证客户端用户帐号密码的逻辑. (3)如果需要使用自定义的主窗体,则实现它. (4)更…
测者的性能测试手册:JVM的监控利器 每次聊起性能测试,最后的终结话题就是怎么做优化.其实在Java的复杂项目中都会有内存不足问题.内存泄露问题.线程死锁问题.CPU问题.这些问题工程测试或者是小压力的情况下有可能并不明显,很容易被忽视.但是到了生产环境,问题就暴露了,各种非功能bug会让你头疼不已. 今天,测者就把自己针对JVM监控.分析常用的工具发给总结一下,也许你就能找打一个你喜欢的. jstat jstat是JVM统计监测工具,主要用来监视java虚拟机的各种运行状态的工具.通过他可以监…
指导手册04:运行MapReduce   Part 1:运行单个MapReduce任务 情景描述: 本次任务要求对HDFS目录中的数据文件/user/root/email_log.txt进行计算处理,统计出第个用户的登录次数. 情景分析:统计出每个用户登录次数,等同于求出每个email出现的次数,可以进一步抽象为统计每个单司出现的频次.在Hadoop官方提供的示例包中,正好有进行记频统计的模块. 1.Hadoop官方的示例程序包 在集群服务器的本地目录”$HADOOP_HOME/share/ha…
目录:Django其他篇 01: 安装zabbix server 02:zabbix-agent安装配置 及 web界面管理 03: zabbix API接口 对 主机.主机组.模板.应用集.监控项.触发器等增删改查 04:获取zabbix监控信息 目录: 1.1 检索警报 1.2 根据host创建 应用集.监控项.触发器(块速开始) 1.1 检索警报返回顶部 参考官网:https://www.zabbix.com/documentation/3.4/zh/manual/api/referenc…
/*************************************************************** * Ubuntu 12.04 流量监控查看 * 说明: * 今天打算从获取Android源代码,但是中间出现一些问题,感觉 * 没有从网络上获取数据了,于是想找一个软件查看,于是找了这个 * nethogs这个工具,挺好用的. * * 2016-8-31 深圳 南山平山村 曾剑锋 ********************************************…
需求说明 编写背景 此手册的基础在于对<jmxtrans + influxdb + granafa 监控套件使用手册>的熟悉和使用.本手册仅介绍以下几项: OpenTSDB 的配置安装 对 json 文件的配置使其可以将数据导入OpenTSDB grafana 对OpenTSDB 数据源的看板配置 适用人群 管理层人员 数据部门人员 运维部门人员 其他想要学习此类知识的人员 配置安装 OpenTSDB 简介 OpenTSDB ,可以认为是一个时系列数据(库),它基于HBase存储数据,充分发挥…
Ganglia是一个监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标. Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通过一台服务端收集到它下属的所有客户端数据.这个体系设计表示一台服务器能够通过不同的分层能够管理上万台机器.这个功能是其他mrtg,nagios,cacti所不能比拟. Ganglia的扩展插件非常好…
一.语法介绍 先来看一个简单的例子: <span data-bind="text:name"></span> var obj = {name:ko.observable("tom")} ko.applyBindings(obj); 这样会自动完成绑定.其中有3个特别的地方:1. data-bind.2.ko.observable 方法. 3.ko.applyBindings 方法. 1.1 data-bind data-bind 并不是htm…
由于android终端usb接口比较松,公司的无线网络使用人过多比较慢,所以想使用PC端无线直连 调试Android终端 配置无线共享 1 网卡要支持 2 安装 plasma-nm sudo apt-get install plasma-nm 3 配置链接 kde5-nm-connection-editor 添加-wifi共享 连接名称:myubuntu SSID:ubuntu wifi-模式:接入点 wifi-安全:选择相应的加密方式和设置密码 ipv4-方法:与其他计算机共享 点击ok 4…
计算监控属性构造参考 计算监控属性可使用以下形式进行构造: ko.computed( evaluator [, targetObject, options] ) - 这种形式是创建一个计算监控属性最常见的情况. evaluator - 用于返回计算值的函数. targetObject-如果给出定义的值this时KO调用回调函数.参见部分第三章 计算监控属性(1) 使用计算监控属性以获取更多信息. options - 计算监控属性的其他属性的对象.请参见下面的完整列表. ko.computed(…
在 ubuntu 14.04 上安装ceph calamari时,遇到calamari web界面中node server可以正常添加,但cluster 集群无法显示的问题. 经过定位,是因为saltstack master/minion 版本不匹配问题. 特记录正确的安装过程. Note: Calamari does not currently support 2015.5 salt please consider using 2014.7 instead Also it is importa…
注:本文转自:http://eric100.blog.51cto.com/2535573/1717792 Opscenter用户手册 1.       OpsCenter简介 DataStaxOpsCenter是一个可视化管理和监控Apache Cassandra和DataStax Enterprise工具.OpsCenter简化了管理任务: 添加扩展集群 配置nodes 查看性能指标 修复问题 监控集群情况 主要功能 OpsCenter主要功能如下: Dashboard 概述显示任何警报和多个…
1.断路器(Circuit Breaker)模式 在上文中,我们人为停掉了一个provider,在实际的生产环境中,因为意外某个服务down掉,甚至某一层服务down掉也是会是有发生的.一旦发生这种情况,我们需要将损失减少到最低限度. 那怎么减少损失.在电力系统中,如果某个电器发生过载等问题,该段电路的继电器中的保险丝就会熔断.在分布式系统中,我们也可以设计这样的模式,并为它赋有专有名词:断路器(Circuit Breaker)模式. 其基本模式在Martin Fowler的一篇文章中进行过专有…
zabbix支持的监控方式 zabbix所能够显示的且可指定为监控接口类型的监控方式: Agent passive active SNMP:Simple Network Management Protocol 基于SNMP协议实现的监控,不需要特意在被监控端安装zabbix-agent,SNMP一般用在无法在被监控端安装zabbix-agent的时候,比如打印机.路由器    MIB.SMI.SNMP(v1.v2.v3) IPMI:智能平台管理接口(Intelligent Platform Ma…
一.新项目接入 0.官方文档: https://book.open-falcon.org/zh_0_2/usage/getting-started.html 1.联系运维人员确定可以使用监控系统: (1)机器内网ip (2)报警接收人的信息(账户,密码) 2.登陆网页,按照官方文档配置监控项: (1)配置机器组hostgroup (2)配置报警模版templete (3)绑定机器组与报警模版 3.监控类型 (1)日志监控 https://github.com/pengzhong2010/open…
#1.gcc编译环境确认 .tgz cd Python- ./configure /bin/python2. /usr/bin/python #运行python查看版本 python -V #进行更改后,yum如果无法运行了 #修改/usr/bin/yum文件,将第一行的 #!/usr/bin/python 改为系统原有的python版本,如下: #!/usr/bin/python2. #6.基础环境安装 下载setuptools包  wget http://pypi.python.org/pa…