[转]NMON服务器监控、指标说明

一、NMON中的各项参数指标：

SYS_SUMM：显示当前服务器的总体性能情况

Total System I/OStatistics：
Avg tps during an interval：显示采集间隔内磁盘平均I/O次数，该值等于Sheet DISK_SUMM中IO/sec列的平均值。
Max tps during an interval：显示采集间隔内磁盘最大I/O次数，该值等于Sheet DISK_SUMM中IO/sec列的最大值。
Max tps interval time：显示磁盘最大I/O所在时间点。
Total number of Mbytes read：显示采集间隔内磁盘读的总兆字节数，可能是nmon的bug，该值并不准确，并且使用LVM划分的虚拟磁盘可能会存在重复统计。
Total number of Mbytes written：显示采集间隔内磁盘写的总兆字节数，该值并不准确，理由同上。
Read/Write Ratio：显示Total number of Mbytes read/ Total number of Mbytes written的值。实时读写比率
IO/sec：仅显示磁盘IO/sec的图，不包括Network的I/O。每秒钟输出到物理磁盘的传输次数

如下图：

CPU：
Users%：显示采集间隔内所有CPU在User Mode下的Time占比（Avg、Max）。
Sys%：显示采集间隔内所有CPU在System Mode下的Time占比（Avg、Max）。
Wait%：显示采集间隔内所有CPU处于空闲且等待I/O完成的时间比例（Wait%是CPU空闲状态的一种，当CPU处于空闲状态而又有进程处于D状态（不可中断睡眠）时，系统会统计这时的时间，并计算到Wait%里），Wait%不是一个时间值，而是时间的比例，因此在同样I/O Wait时间下，服务器CPU越多，Wait%越低，它体现了I/O操作与计算操作之间的比例。对I/O密集型的应用来说一般Wait%较高，且Sheet PROC中Blocked也较高，这时需关注是什么导致了过多的进程等待。
Idle%：显示采集间隔内所有CPU处于空闲Time的占比（Avg、Max）。
CPU%：显示采集间隔内所有CPU的user%+system%。
2. AAA
显示当前服务器基本信息，如操作系统版本，当前LPAR名，采集时间和次数等如下图

3. StrayLines
显示本次nmon分析文件中未生成的采集值。
4. BBBP
由于本Sheet内容较多，见下图(部分截图)：

（截图一）
如上图，显示当前服务器的基础资源信息，当前服务器操作系统是cent os版本。

MemTotal：显示当前服务器物理内存大小，本服务器有8063180 KB≈7874 MB左右。
MemFree：显示当前服务器的空闲内存大小，本服务器有5052336 KB≈4934 MB左右。
Buffers：显示当前服务器Buffer（在内存中要写到磁盘上的）缓存的大小，本服务器有459108 KB≈448 MB左右，注意，这里的数值仅是采集初期的静态值，具体Buffer的变化还需要看Sheet MEM。
Cached：显示当前服务器Cache缓存的大小（从磁盘读取到内存的），本服务器有1032572 KB≈1008 MB左右。，这里的数值仅是采集初期的静态值，具体Buffer的变化还需要看Sheet MEM。
SwapCached：显示当前服务器Swap空间已缓存的大小，本服务器尚未使用到Swap空间。
SwapTotal：显示当前服务器Swap空间大小，本服务器有8385532 KB≈8189 MB左右。
SwapFree：显示当前服务器Swap空闲空间大小，本服务器Swap空间都空闲。

由于执行nmon时所属系统组权限不同，因此BBBP里磁盘的信息可能会缺失，如截图一是root权限执行nmon生成文件后显示的磁盘信息，可以看到每个磁盘的大小及磁盘下的分区用途。
5. CPU_ALL
显示当前服务器所有CPU在采集时间段内的利用率，按时间及User%、System%、Wait%显示。

当前服务器共有4颗CPU（Core）8核心。
一般情况下CPU利用率里User%应占70%左右，Sys%应占30%左右，如果Sys%或Wait%占比等于或超过了User%则应该关注是什么引起了过多的系统消耗，可能是大量的Disk或Network I/O。
如下图，这个项目随着并发的增加，应用进程对CPU的消耗都增加在Wait%上，经排查是由于NFS读写遇到瓶颈导致：

6. CPU_SUMM
显示当前服务器所有CPU的利用率，当前服务器共有4个CPU（Core），每个CPU负载有所不同。

7. DISK_SUMM
按采集时间显示所有磁盘和分区的Read/Write的速率（KB/s）和所有磁盘和分区的I/O率。某一采集时间点的IO/sec等于Sheet DISKXFER中该时间点上所有磁盘和分区的IO/sec之和。因此，这一时间点上的I/O值是重复的！另外，本Sheet中的I/O不包括NFS里的I/O。

如上图的WAvg按nmon Guide中的说法是为了去掉采集值中的零值以便贴近真实平均值，但WAvg的公式（对计算列中所有值取平方后加合，再除以列中所有值之和）却不是单纯的去掉零值，这里可以理解为WAvg比Avg更贴近资源消耗的均值，因此以后所有资源Sheet中都推荐关注WAvg。
IBM Redpaper《Linux Performance and Tuning Guidelines》中介绍Linux的I/O子系统架构如下：

nmon（包括iostat）对系统I/O的指标截取大部分来自/proc/diskstats，而这些值来自block layer层，LVM里的Logical Volume会“visible as a standard block device”，因此真实的磁盘，LVM的逻辑卷，分区等在这里都会显示，在nmon计算总值时会被重复统计。
Disk Read/Write KB是同一采集时间点下Sheet DISKREAD、DISKWRITE里该行（所有磁盘和分区）数值之和，必然包括了重复值，例如某一时刻sda磁盘共write 1000 KB，其中sda1分区write 700 KB，sda3分区write 300 KB，这一时刻Disk Write应是1000 KB，但这里却会重复统计分区数值，导致显示为Disk Write 2000 KB。Disk I/O也存在同样的问题！
还需注意一点，部分nmon生成文件里图中标题指标为kb（小写）/s，但实际统计的却是KB（大写）/s。

http://blog.csdn.net/he_jian1/article/details/41039709/

[转]NMON服务器监控、指标说明的更多相关文章

Windows服务器使用Telegraf采集服务器监控指标输出到influxdb
1.环境说明操作系统:Windows Server 2008 R2 IP:192.168.10.135 官方文档地址 :https://docs.influxdata.com/telegraf/v1 ...
jmeter服务器监控插件指标简单说明
以下是下载了服务器监控插件的各个组件的功能介绍,有助于以后jmeter的性能测试 1.jp@gc - Actiive Threads Over Time:不同时间的活动用户数量展示(图表) 当前的时间 ...
【转载】apache kafka系列之-监控指标
原文地址:http://blog.csdn.net/lizhitao/article/details/24581907 1.监控目标 1.当系统可能或处于亚健康状态时及时提醒,预防故障发生 2.报警提 ...
[转载]你需要知道的 16 个 Linux 服务器监控命令
转载自: 你需要知道的 16 个 Linux 服务器监控命令如果你想知道你的服务器正在做干什么,你就需要了解一些基本的命令,一旦你精通了这些命令,那你就是一个专业的 Linux 系统管理员. 有些 ...
Linux CPU监控指标
Linux CPU监控指标 Linux提供了非常丰富的命令可以进行CPU相关数据进行监控,例如:top.vmstat等命令.top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执 ...
Nmon实时监控并生成HTML监控报告
前面的博客介绍了服务端监控工具:Nmon使用方法,最近在github找到了一个nmon自动监控并生成HTML格式报告的工具:easyNmon,使用体验蛮不错的,这里介绍下它的安装及使用方法. 一.关于 ...
Hadoop记录- zookeeper 监控指标
目前zookeeper获取监控指标已知的有两种方式: 1.通过zookeeper自带的 four letter words command 获取各种各样的监控指标 2.通过JMX Client连接zo ...
【MySQL】常用监控指标及监控方法
对之前生产中使用过的MySQL数据库监控指标做个小结. 指标分类指标名称指标说明性能类指标 QPS 数据库每秒处理的请求数量 TPS 数据库每秒处理的事务数量并发数数据库实例当前并行处理的 ...
【转载】阿里云ECS服务器监控资源使用情况
在阿里云Ecs服务器运维过程中,无论是Centos系统还是Windows系统,有时候我们需要监控分析最新的服务器资源利用率等运行情况,例如最近3个小时CPU使用率情况.内存使用率.网络流入带宽.网络流 ...

随机推荐

Meta Blogging
Meta Blogging 由来偶然想到说如果哪一天cnblogs挂了,那之前记录的随笔怎么办?可不可以把它们给download下来本地保存一份.正好看到有个库叫requests, 干嘛不试试看呢. ...
CSS控制当鼠标滑过时更换图片的效果
鼠标滑过时更换图片的效果有很多方法可以实现,在本文将为大家介绍喜爱如何通过css来实现.<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Tra ...
PCIE BAR空间
PCIE应用程序编程,首先就要理清PCIE BAR空间到底说的是什么.在PCIE配置空间里,0x10开始后面有6个32位的BAR寄存器,BAR寄存器中存储的数据是表示PCIE设备在PCIE地址空间中的 ...
Javac编译器
One Compiler http://www.oracle.com/technetwork/java/jvmls2016-wimmer-3125555.pdf Hacking the OpenJDK ...
posix多线程--线程取消
1.三种取消状态Off 禁用取消Deferred 推迟取消:在下一个取消点执行取消Asynchronous 异步取消:可以随时执行取消 in ...
How-to: Tune Your Apache Spark Jobs (Part 1)
Learn techniques for tuning your Apache Spark jobs for optimal efficiency. When you write Apache Spa ...
AngularJS官网seed目录结构
1.AngularJS官网seed目录结构 css/ img/ js/ app.js controllers.js directives.js filters.js services.js lib/ ...
PHP的HashTable实现
转载自: http://it.taocms.org/07/1145.htm 数据结构: HashTable数据结构的描述在Zend/zend_hash.h文件中.首先,HashTable中的每一个元素 ...
[MMC]Linux MMC/SD/SDIO驱动分析
转自:http://www.cnblogs.com/cslunatic/p/3678045.html 一.SD/MMC/SDIO概念区分 SD(SecureDigital)与 MMC(Multimed ...
[4G]Linux平台上实现4G通信
转自:http://blog.sina.com.cn/s/blog_7880d3350102wb92.html 在ARM平台上实现4G模块的PPP拨号上网,参考网上的资料和自己的理解,从一无所知到开发 ...

[转]NMON服务器监控、指标说明

[转]NMON服务器监控、指标说明的更多相关文章

随机推荐

热门专题