linux硬件资源问题排查:cpu负载、内存使用情况、磁盘空间、磁盘IO
在使用过程中之前正常的功能,突然无法使用,性能变慢,通常都是资源消耗问题,资源消耗可以从以下几个方面去排查。对于已经安装硬件资源监控软件(zabbix)的环境,直接使用硬件资源监控软件(zabbix),检查服务器的资源消耗情况,在没有安装zabbix的环境,主要排查的资源包括CPU负载、内存使用情况、磁盘空间、磁盘IO等。
1.1.1 cpu负载
cpu负载就是cpu在一段时间内正在处理以及等待cpu处理的进程数之和的统计信息,也就是cpu使用队列的长度统计信息,这个数字越小越好。
使用top指令将会输出如下结果
load average代表CPU的平均负载值,示例中的load average: 1.30, 1.27,1.28分别表示当前CPU在1分钟、5分钟和15分钟内的平均负载。对于单核cpu,一旦大于1,就说明job得不到及时调度,系统性能将会受到影响。对于2核心来说,该值大于2才说明cpu忙不过来。
在top指令输出结果后,输入P,将进程按%cpu降序排列,查看哪些进程在大量占用cpu,输入M,将进程按%MEM降序排列,查看哪些进程在大量占用内存。
1.1.2 内存使用情况
使用free -h查看内存使用情况。
# free -h total used free shared buff/cache available Mem: 15G 12G 295M 38M .8G .6G Swap: .9G 416M .5G
total表示系统总的可用物理内存大小,used表示已经使用的物理内存大小,available可以被 应用程序 使用的物理内存大小,当可使用的物理内存大小较小时,结合top指令,查看哪些应用程序占用的大量内存。
1.1.3 磁盘空间
使用df -h查看系统的磁盘使用情况。
# df -h 文件系统 容量 已用 可用 已用% 挂载点 /dev/sda2 50G 24G 27G % / devtmpfs .8G .8G % /dev tmpfs .8G 28K .8G % /dev/shm tmpfs .8G 37M .8G % /run tmpfs .8G .8G % /sys/fs/cgroup /dev/sdb2 40G .8G 36G % /var/scs /dev/sdc2 30G 20G 11G % /home /dev/sda1 494M 208M 287M % /boot /dev/sdc1 249G 108G 142G % /home/sdc /dev/sdb1 239G 133G 107G % /home/sdb /dev/sda5 220G 101G 120G % /home/sda tmpfs .6G .0K .6G % /run/user/ tmpfs .6G 32K .6G % /run/user/
对于磁盘使用情况,主要关注已用%,已用%大于80%后要开始清理无效日志、不在使用的安装包等。
已用%较大的挂载点,使用du -sh 挂载点/*,查看挂载点内个文件、目录的实际大小。
# du -sh /home/* 20K /home/bats 0 /home/data 127M /home/dba 85M /home/dba1.5.5 9.5G /home/dbus 23M /home/dbus_processor 4.0M /home/hcloud 65M /home/kafka 13M /home/log.tmp 188K /home/lost+found 93M /home/ltest
1.1.4 磁盘IO
使用iostat -x 5查看磁盘IO使用情况。
# iostat -x Linux 3.10.-957.5..el7.x86_64 (node9) 2020年04月09日 _x86_64_ ( CPU) avg-cpu: %user %nice %system %iowait %steal %idle 27.61 0.03 3.72 0.12 0.00 68.52 Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.01 0.05 5.46 6.23 166.86 351.76 88.76 0.04 3.02 2.45 3.52 0.31 0.36 sda 2.28 5.02 1.24 28.60 36.80 658.85 46.63 0.01 0.24 3.89 0.08 0.12 0.35 sdc 0.01 0.03 0.33 1.07 2.61 8.68 16.14 0.00 0.62 2.50 0.03 0.43 0.06 avg-cpu: %user %nice %system %iowait %steal %idle 3.32 0.00 4.50 0.00 0.00 92.18 Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.00 0.00 0.00 3.60 0.00 56.00 31.11 0.00 0.00 0.00 0.00 0.00 0.00 sda 0.00 0.20 0.00 32.40 0.00 669.60 41.33 0.00 0.06 0.00 0.06 0.04 0.14 sdc 0.00 0.00 0.00 0.60 0.00 2.40 8.00 0.00 0.00 0.00 0.00 0.00 0.00 avg-cpu: %user %nice %system %iowait %steal %idle 4.18 0.00 5.25 0.00 0.00 90.57 Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.00 0.20 0.00 7.80 0.00 138.40 35.49 0.00 0.05 0.00 0.05 0.05 0.04 sda 0.00 0.00 0.00 29.40 0.00 952.00 64.76 0.00 0.07 0.00 0.07 0.03 0.08 sdc 0.00 0.00 0.00 1.40 0.00 12.80 18.29 0.00 0.00 0.00 0.00 0.00 0.00
重点关注参数:
1、iowait% 表示CPU等待IO时间占整个CPU周期的百分比,如果iowait值超过50%,或者明显大于%system、%user以及%idle,表示IO可能存在问题。
2、avgqu-sz 表示磁盘IO队列长度,即IO等待个数。
3、await 表示每次IO请求等待时间,包括等待时间和处理时间
4、svctm 表示每次IO请求处理的时间
5、%util 表示磁盘忙碌情况,一般该值超过80%表示该磁盘可能处于繁忙状态。
pidstat -d 3命令查看进程占用磁盘IO的情况
kB_rd/s: 每秒进程从磁盘读取的数据量(以kB为单位)
kB_wr/s: 每秒进程向磁盘写的数据量(以kB为单位)
# pidstat -d Linux 3.10.-957.5..el7.x86_64 (node9) 2020年04月09日 _x86_64_ ( CPU) 13时35分30秒 UID PID kB_rd/s kB_wr/s kB_ccwr/s Command 13时35分33秒 0.00 1.29 0.00 dockerd 13时35分33秒 0.00 45.31 0.00 loop0 13时35分33秒 0.00 1.29 0.00 rsyslogd 13时35分33秒 0.00 2.59 0.00 java 13时35分33秒 0.00 2.59 0.00 java 13时35分33秒 0.00 1.29 0.00 java 13时35分33秒 0.00 132.04 0.00 mysqld 13时35分33秒 0.00 1.29 0.00 java 13时35分33秒 0.00 1.29 0.00 java 13时35分33秒 0.00 3.88 0.00 java 13时35分33秒 0.00 1.29 0.00 java
linux硬件资源问题排查:cpu负载、内存使用情况、磁盘空间、磁盘IO的更多相关文章
- Linux查看CPU和内存使用情况 【转】
Linux查看CPU和内存使用情况 在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应信息分析系统状况的需要.在 CentOS 中,可以通过 top 命令来查看 CPU 使用状况.运行 ...
- 操作系统复习——如何查看一个进程的详细信息,如何追踪一个进程的执行过程 ,如何在 Linux 系统下查看 CPU、内存、磁盘、IO、网卡情况?epoll和select区别?
1. 如何查看一个进程的详细信息,如何追踪一个进程的执行过程 通过pstree命令(根据pid)进行查询进程内部当前运行了多少线程:# pstree -p 19135(进程号) 使用top命令查看(可 ...
- Linux查看CPU和内存使用情况总结
Linux查看CPU和内存使用情况:http://www.cnblogs.com/xd502djj/archive/2011/03/01/1968041.html 在做Linux系统优化的时候,物理内 ...
- SQLSERVER排查CPU占用高的情况
SQLSERVER排查CPU占用高的情况 今天中午,有朋友叫我帮他看一下数据库,操作系统是Windows2008R2 ,数据库是SQL2008R2 64位 64G内存,16核CPU 硬件配置还是比较高 ...
- 查看计算机CPU、内存使用情况
Shift + Ctrl + Esc,打开Windows任务管理器,点击性能,如图: 可以清楚的看到整台机子的CPU.内存使用情况,其中CPU使用记录下有8个小窗口,因为博主的CPU是8核的,讲讲CP ...
- Linux系统排查——CPU负载篇
本随笔介绍CPU负载的排查手段. 查看系统负载的工具:uptime,w,都能查看系统负载,系统平均负载是处于运行或不可打扰状态的进程的平均数, 可运行:运行态,占用CPU,或就绪态,等待CPU调度. ...
- Linux查看CPU和内存使用情况(转)
在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应信息分析系统状况的需要.在 CentOS 中,可以通过 top 命令来查看 CPU 使用状况.运行 top 命令后,CPU 使用状态会 ...
- Linux查看CPU和内存使用情况
在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应信息分析系统状况的需要.在 CentOS 中,可以通过 top 命令来查看 CPU 使用状况.运行 top 命令后,CPU 使用状态会 ...
- Linux查看CPU和内存使用情况【转】
转自:http://www.cnblogs.com/xd502djj/archive/2011/03/01/1968041.html 在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应 ...
随机推荐
- 从0开始搭建kafka客户端
上一节,我们实现了搭建kafka集群.本节我们将从0开始,使用Java,搭建kafka客户端生产消费模型. 1.创建maven项目2.kafka producer3.kafka consumer4.结 ...
- mysql从5.5升级到5.7遇到的坑
在安装mysql5.7时很顺利安装完成,但在启动项目时报错: [Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clau ...
- 关于Java序列化的问题你真的会吗?
引言 在持久化数据对象的时候我们很少使用Java序列化,而是使用数据库等方式来实现.但是在我看来,Java 序列化是一个很重要的内容,序列化不仅可以保存对象到磁盘进行持久化,还可以通过网络传输.在平时 ...
- 一起了解 .Net Foundation 项目 No.17
.Net 基金会中包含有很多优秀的项目,今天就和笔者一起了解一下其中的一些优秀作品吧. 中文介绍 中文介绍内容翻译自英文介绍,主要采用意译.如与原文存在出入,请以原文为准. Peachpie Comp ...
- 基于osg的python三维程序开发(二)------向量
上一篇文章展示了如何简单创建一个osg python 程序, 本篇展示了了一些基础数据结构的使用: from pyosg import * vec = osg.Vec3Array() #push ba ...
- 为.net Core 3.0 WebApi 创建Linux守护进程
前言 我们一般可以在Linux服务器上执行 dotnet <app_assembly.dll> 命令来运行我们的.net Core WebApi应用.但是这样运行起来的应用很不稳定,关闭终 ...
- kafka实现无消息丢失与精确一次语义(exactly once)处理
在很多的流处理框架的介绍中,都会说kafka是一个可靠的数据源,并且推荐使用Kafka当作数据源来进行使用.这是因为与其他消息引擎系统相比,kafka提供了可靠的数据保存及备份机制.并且通过消费者位移 ...
- 【题解】NOIP 2015 子串
淦!这题我做了三个月啊 题目描述 有两个仅包含小写英文字母的字符串 \(A\) 和 \(B\). 现在要从字符串 \(A\) 中取出 \(k\) 个互不重叠的非空子串,然后把这 \(k\) 个子串按照 ...
- android弱网络优化
1 网络请求,使用更好的网络请求方式 flutter有3种请求方式,flutter自带的io下httpclient请求,使用dart原生的http请求,dio请求. flutter还可以通过调用and ...
- Python 之 GIL 全局解释器锁
GIL(全局解释器锁) GIL锁即全局解释器锁,是 CPython 解释器的特性.它的作用是保证了同一时刻只有一个线程执行 Python 字节码. 它并不是 Python 的特性,它的存在是 CPyt ...