zabbix cpu 负载不对的原因】的更多相关文章

最近给客户安装了一个zabbix服务器,运行了几天发现cpu load值不准确, 请教了运维和系统工程师,说是zabbix2.0以后的问题.   解决方案如下1(推荐): 修改模板(Template OS Linux)--项目--Processor load (1 min average per core)--键值: 把 system.cpu.load[percpu,avg1] 改为 system.cpu.load[all,avg1]    解决方案如下2: 修改模板(Template OS L…
原因总结 产生的原因一句话总结就是:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是cpu运行的进程却很少,这样就体现到负载过大了,cpu使用率低. 下面内容是具体的原理分析:在分析负载为什么高之前先介绍下什么是负载.多任务操作系统.进程调度等相关概念. 什么是负载 什么是负载:负载就是cpu在一段时间内正在处理以及等待cpu处理的进程数之和的统计信息,也就是cpu使用队列的长度统计信息,这个数字越小越好(如果超过CPU核心*0.7就是不正常) 负载分为两大部分:CPU负载.IO负载 例…
最近有套系统数据库周末总是告警,CPU使用率超过90%,开始由开发那边再跟进处理,我也就没参与,后来发现没进展就登录上去看了下,然后进行了部分优化,优化后效果还是比较明显的,具体优化过程本文会做详细的阐述. 一.现象描述 数据库服务器CPU使用率超过90%,而此数据库架构为mycat对应的一主三从(之前一主二从,由于CPU使用率高,开发那边对库做了扩展,从负载均衡的角度降低CPU压力,从效果上看没达到应有的效果),其中mycat的负载策略是3,即所有读操作分配到从库上完成,但实际是主库抓包发现也…
本随笔介绍CPU负载的排查手段. 查看系统负载的工具:uptime,w,都能查看系统负载,系统平均负载是处于运行或不可打扰状态的进程的平均数, 可运行:运行态,占用CPU,或就绪态,等待CPU调度. 不可打扰:阻塞,正在等待I/O 例1. 使用uptime查看系统负载 # uptime :: up days, :, user, load average: 0.67, 0.51, 0.41 这里我们关注的是最后三列,即系统1分钟.5分钟.15分钟内的平均负载,判断一个系统负载是否偏高需要计算单核C…
NIOS II CPU复位异常的原因及解决方案   近期在用nios ii做项目时,发现一个奇怪的现象,在NIOS II EDS软件中编写好的代码,烧写到芯片中,第一次能够正常运行,但是当我按下板卡上的复位键之后,系统却卡死了,再也运行不起来,除非重新下载程序.经过分析系统可知,系统的硬件设计和Qsys系统中NIOS II CPU系统的搭建都是没有任何问题的.那么为什么会存在这样的问题呢,这里我先简单介绍下我的系统: 我的系统主要由NIOS II最强板CPU,SDRAM.预留系统定时器.预留时间…
文章出处:http://blog.chinaunix.net/uid-12693781-id-368837.html 摘要:确定cpu的负载的定义,帮助管理员设置cpu负载阀值,推测可能的导致cpu负载过高的原因,进而保证服务器的正常运行.   1.cpu负载的定义    首先,看看cpu负载的定义.在一般情况下可以将单核心cpu的负载看成是一条单行的桥,数字1代表cpu刚好能够处理过来,即桥上能够顺利通过所有的车辆, 桥外没有等待的车辆,桥是畅通的.当超过1时表示有等待上桥的车辆,小于1时表示…
本随笔介绍CPU负载的排查手段. 查看系统负载的工具:uptime,w,都能查看系统负载,系统平均负载是处于运行或不可打扰状态的进程的平均数, 可运行:运行态,占用CPU,或就绪态,等待CPU调度. 不可打扰:阻塞,正在等待I/O 例1. 使用uptime查看系统负载. # uptime :: up days, :, user, load average: 0.67, 0.51, 0.41 这里我们关注的是最后三列,即系统1分钟.5分钟.15分钟内的平均负载,判断一个系统负载是否偏高需要计算单核…
原链接:http://blog.chinaunix.net/uid-12693781-id-368837.html 摘要:确定cpu的负载的定义,帮助管理员设置cpu负载阀值,推测可能的导致cpu负载过高的原因,进而保证服务器的正常运行.   1.cpu负载的定义    首先,看看cpu负载的定义.在一般情况下可以将单核心cpu的负载看成是一条单行的桥,数字1代表cpu刚好能够处理过来,即桥上能够顺利通过所有的车辆, 桥外没有等待的车辆,桥是畅通的.当超过1时表示有等待上桥的车辆,小于1时表示车…
CPU负载和 CPU使用率 这两个从一定程度上都可以反映一台机器的繁忙程度. cpu使用率反映的是当前cpu的繁忙程度,忽高忽低的原因在于占用cpu处理时间的进程可能处于io等待状态但却还未释放进入wait. 平均负载(load average)是指某段时间内占用cpu时间的进程和等待cpu时间的进程数,这里等待cpu时间的进程是指等待被唤醒的进程,不包括处于wait状态进程. 以上分析可以看出,一台机器很有可能处于低cpu使用率高负载的情况,因此看机器的繁忙程度应该结合两者,从实际的使用情况观…
转自:http://oenhan.com/cpu-load-balance 还是神奇的进程调度问题引发的,参看Linux进程组调度机制分析,组调度机制是看清楚了,发现在重启过程中,很多内核调用栈阻塞在了double_rq_lock函数上,而double_rq_lock则是load_balance触发的,怀疑当时的核间调度出现了问题,在某个负责场景下产生了多核互锁,后面看了一下CPU负载平衡下的代码实现,写一下总结. 内核代码版本:kernel-3.0.13-0.27. 内核代码函数起自load_…
一.CPU utilization 使用Zabbix查看CPU利用率,会有下面几个值: CPU idle time:空闲的cpu时间比[简称id]CPU user time:用户态使用的cpu时间比[简称us]CPU system time:系统态使用的cpu时间比[简称sy]CPU iowait time:cpu等待磁盘写入完成时间[简称wa]CPU nice time:用做nice加权的进程分配的用户态cpu时间比[简称ni]CPU interrupt time:硬中断消耗时间[简称hi]C…
背景 Read the fucking source code! --By 鲁迅 A picture is worth a thousand words. --By 高尔基 说明: Kernel版本:4.14 ARM64处理器,Contex-A53,双核 使用工具:Source Insight 3.5, Visio 1. 概述 CPU负载(cpu load)指的是某个时间点进程对系统产生的压力. 来张图来类比下(参考Understanding Linux CPU Load) CPU的运行能力,就…
在使用过程中之前正常的功能,突然无法使用,性能变慢,通常都是资源消耗问题,资源消耗可以从以下几个方面去排查.对于已经安装硬件资源监控软件(zabbix)的环境,直接使用硬件资源监控软件(zabbix),检查服务器的资源消耗情况,在没有安装zabbix的环境,主要排查的资源包括CPU负载.内存使用情况.磁盘空间.磁盘IO等. 1.1.1    cpu负载 cpu负载就是cpu在一段时间内正在处理以及等待cpu处理的进程数之和的统计信息,也就是cpu使用队列的长度统计信息,这个数字越小越好. 使用t…
博主在阿里云服务器上安装了主机软件Blesta后,阿里云后台频繁提示CPU超载,打开突发性能模式后,发现CPU负载到了100%.如下图所示: 直接在putty里面reboot整个系统后,负载瞬间降为2%.此时如果一直不访问网页的话,负载将维持在3%附近.如果仅是客户买东西,负载也不会高.   但是一旦管理员在后台添加产品,更新支付网关等操作后,负载就立马上来了.所以见使用blesta过程中,强烈建议管理员在后台操作添加产品.更新支付网关后,立马重启服务器,避免阿里云服务器重载运行,造成额外的费用…
1.背景:从昨天晚上通过钉钉和邮箱一直接收到频繁报cpu负载超过90%,刚好BI同事晚上.凌晨在线上配合审计频繁DML数据库(备注:BI有一个同事有个库的DML权限,后面等审计完会收回)加上我线上线下在做定时同步和以前这种事也有发生,就没有当回事. 今天早上一来巡检,就发现了异常. 2.以下大量语句频繁,发现是另外一个库(另一个业务,并发量比较大),不是1的原因. explain分析,发现没有走索引 type:ALL 执行时间都是7秒以上. 3.desc table结构,发现ad_id这个字段是…
理解Linux系统负荷 linux里的CPU负载…
最近几天一直遇到服务器cpu100%, 通过top命令发现plymouthd进程cpu负载达到近100% 解决方法:打开 /boot/grub/menu.lst , 去掉 “rhgb quiet”这两个参数 ,然后重启…
昨晚和一位读者朋友讨论了一个问题:在一台多核 CPU 的 Web 服务器上,存在负载不均衡问题,其中 CPU0 的负载明显高于其它 CPUx,进一步调查表明 PHP-FPM 的嫌疑很大.话说以前我曾经记录过软中断导致过类似的问题,但是本例中可以排除嫌疑.让我们在一台四核服务器上采样分析一下数据确认看看是否存在负载不均衡问题:shell> mpstat -P ALL 1 10 CPU    %usr   %nice    %sys %iowait    %irq   %soft ... %idle…
昨天查看Nagios警报信息,发现其中一台服务器CPU负载过重,机器为CentOS系统.信息如下: 2011-2-15 (星期二) 17:50 WARNING - load average: 9.73, 10.67, 10.49 还有前两个小时发出的警报信息: 2011-2-15 (星期二) 16:50 WARNING - load average: 10.52, 10.10, 10.06 2011-2-15 (星期二) 15:40 WARNING - load average: 8.27, 9…
原文:http://ecos.sourceware.org/docs-latest/ref/services-cpuload.html 译文:http://blog.csdn.net/zoomdy/article/details/17078995 mingdu.zheng <at> gmail <dot> com cpuload组件包提供了一种估算CPU负载的方式.它可以估算最近0.1秒.1秒和10秒内的CPU负载百分比. 负载测量API 首先,必须在被测目标机上对测量算法进行校准…
一个top命令不就行了么?顶多再加一些管道什么的过滤一下.我一开始也是这么想得.其实还可以理解的更多. 首先一个问题,是统计某个时间点的CPU负载,还是某个时间段的? 为了画折线图报表,一般横坐标都是某个时间点,也就是希望能够统计某个时间点的CPU负载,但这是很难办得到的.比较容易的做法是通过两个时间点之间的CPU负载,也就是某个时间段.如果要做benchmark,就把时间段变得很小,1秒甚至更小.如果要常规监控, 可以将时间段放大到1分钟,甚至更多. 第二个问题,用什么来判断某个时间段的CPU…
转自:https://blog.csdn.net/Alisa_xf/article/details/71430406 在Linux/Unix下,CPU利用率(CPU utilization)分为用户态,系统态和空闲态,分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间.平时所说的CPU利用率是指:CPU执行非系统空闲进程的时间 / CPU总的执行时间.(上述代码中使用的方法为:1 - CPU空闲运行时间/总运行时间 ,与这个计算方法原理上是一样的)      在Li…
原理说明 在对服务器进行维护时,有时也遇到由于系统 CPU(利用率)负载过高导致业务中断的情况.服务器上可能运行多个进程,查看单个进程的 CPU 都是正常的,但是整个系统的 CPU 负载可能是异常的.通过脚本对系统 CPU 负载进行时时监控,可以在异常时及时发送告警,便于维护人员及时处理,预防事故发生.下面的函数可以检测系统 CPU 使用情况 .使用 vmstat 取 5 次系统 CPU 的 idle 值,取平均值,然后通过与 100 取差得到当前 CPU 的实际占用值. vmstat(Virt…
昨天查看Nagios警报信息,发现其中一台服务器CPU负载过重,机器为CentOS系统.信息如下: 2011-2-15 (星期二) 17:50 WARNING - load average: 9.73, 10.67, 10.49 还有前两个小时发出的警报信息: 2011-2-15 (星期二) 16:50 WARNING - load average: 10.52, 10.10, 10.06 2011-2-15 (星期二) 15:40 WARNING - load average: 8.27, 9…
WHAT?? 1.CPU负载都有哪些? cpu负载的定义:在一般情况下可以将单核心cpu的负载看成是一条单行的桥,数字1代表cpu刚好能够处理过来,即桥上能够顺利通过所有的车辆,桥外没有等待的车辆,桥是畅通的.当超过1时表示有等待上桥的车辆,小于1时表示车辆能够快速的通过.单核心cpu就表示该cpu能够处理的事务数是1,在多核cpu中cpu能够并行处理的事务的数量应该是cpu个数*cpu核数,而且负载数最好不要超过这个数值.例如一个4核cpu,则cpu_load最大值为4,不能长期超过4,否则会…
哪些工具可以查看 CPU 负载? 可以使用 top 命令.uptime 命令,特别是 top 命令,功能强大,不仅仅可以用来查看 CPU 负载. CPU 负载怎么理解?是不是 CPU 利用率? 要区别 CPU 负载和 CPU 利用率,它们是不同的两个概念,但它们的信息可以在同一个 top 命令中进行显示.CPU 利用率显示的是程序在运行期间实时占用的 CPU 百分比,而 CPU 负载显示的是一段时间内正在使用和等待使用 CPU 的平均任务数.CPU 利用率高,并不意味着负载就一定大.网上有篇文章…
参考CSDN博客:https://blog.csdn.net/ffzhihua/article/details/87257607 一.概念(本人理解) CPU负载:平均负载(load average)是指某段时间内占用cpu的进程(已经在被执行的进程数)和等待等待cpu时间的进程数(这里等待cpu时间的进程是指等待被唤醒的进程),不包括处于wait状态进程(还未被执行却等待被执行的进程数). CPU使用率:指当前CPU被使用的程度,反映的是当前cpu的繁忙程度,忽高忽低的原因在于占用cpu处理时…
概述 做压力测试的时候,我们经常会关注两个指标,CPU利用率和CPU负载 Linux中,进程分为三种状态: 阻塞的进程blocked process 可运行的进程runnable process 正在运行的进程running process 当进程处于不可中断时,进程会等待I/O设备的数据或者系统调用:进程处于可运行状态时,它处在一个运行队列中,与其他可运行进程争夺CPU CPU使用率 CPU使用率指的是程序在运行期间实时占用的CPU百分比,这是对一个时间段内CPU使用状况的统计. 通过这个指标…
原文 Linux CPU负载状态:%us/%sy/%ni/%id/%wa/%hi/%si/%st含义 缙哥哥发现用了雅黑的探针,在 Linux 的 CPU 状态信息中发现,有“%us.%sy.%ni.%id.%wa.%hi.%si.%st”等状态.不仅如此,你用 ssh 在服务器上使用“top”命令,也可以看到以上几项参数状态,这些是什么意思呢?缙哥哥今天查了一些文章,学习后跟大家分享一下! CPU 相关监控项 us:用户空间占用CPU百分比(Host.cpu.user) sy:内核空间占用CP…
系统参数检查: df -h [enter] 检查硬盘空间 TIP: 使用 man df 可查看该命令使用说明 ; q 退出. free检查内存使用情况: free [enter] TIP: 使用 man free 可查看该命令使用说明 ; q 退出. top命令检查线程的cpu负载情况: top [enter] TIP: 使用 man top可查看该命令使用说明 ; q 退出. jstack命令查看线程内存信息: jstack pid [enter] TIP: 使用 man jstack 可查看…