Linux 系统负载查询及分析说明
Linux 系统出现死机或卡顿时,可以参阅如下步骤进行整体排查:
- 检查服务器进程与服务否占用了过多内存,或者内存没有正常释放,导致出现内存溢出,系统宕机。
- 检查 /var/spool/cron 等系统配置中是否有 cron(计划任务、自动任务)在对应时间段内执行。
- 检查 Web 服务器的参数是否超过了服务器的性能。比如最大连接数过高等。
- 检查进程数是否非常高,导致服务瘫痪,机器假死。
- 查看系统日志中是否有异常记录。
- 检查磁盘是否有坏块。
- 内核消耗过大,查看是否有瞬间资源占用过大的进程或服务。
- 查看是否有异常进程,是否存在被攻击或入侵症状。
使用 sar 查看 Linux 系统各项资源使用情况
sar 是System Activity Reporter(系统活动情况报告)的缩写。sar 工具对系统状态进行取样后,=通过计算数据和比例来表达系统当前的运行状态。其特点是可以连续对系统取样,获得大量的取样数据。其取样数据和分析结果可以存入文件,所需的负载很小。
sar 是 Linux 系统中较为全面的性能分析工具,可以从多个方面对系统的活动进行监控和报告,包括文件读写情况、系统调用使用情况、串口、CPU 效率、内存使用情况、进程活动及 IPC 有关的活动情况等等。
安装
使用 yum install sysstat 进行安装,然后使用 /etc/init.d/sysstat start 启动服务。
- 查看 CPU 负载
用法:sar -u 1 5
示例输出:
sar -u 1 5
Linux 3.10.0-123.9.3.el7.x86_64 (iZ23pddtofdZ) 07/04/2016 _x86_64_ (1 CPU) 10:16:35 AM CPU %user %nice %system %iowait %steal %idle
10:16:36 AM all 14.14 0.00 1.01 0.00 0.00 84.85
10:16:37 AM all 14.14 0.00 0.00 1.01 0.00 84.85
10:16:38 AM all 0.00 0.00 1.01 0.00 0.00 98.99
10:16:39 AM all 0.00 0.00 0.00 0.00 0.00 100.00
10:16:40 AM all 1.00 0.00 0.00 0.00 0.00 99.00
Average: all 5.86 0.00 0.40 0.20 0.00 93.54回显说明:
- %user:用户模式下消耗的 CPU 时间的比例。
- %nice:通过 nice 改变了进程调度优先级的进程,在用户模式下消耗的 CPU 时间的比例。
- %system:系统模式下消耗的 CPU 时间的比例。
- %iowait:CPU 等待磁盘 I/O 导致空闲状态消耗的时间比例。
- %steal:利用 Xen 等操作系统虚拟化技术,等待其它虚拟 CPU 计算占用的时间比例。
- %idle:CPU 空闲时间比例。
- 查看平均负载
用法:sar -q 1 60
示例输出:
sar -q 1 6
Linux 3.10.0-123.9.3.el7.x86_64 (iZ23pddtofdZ) 07/04/2016 _x86_64_ (1 CPU) 10:23:13 AM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
10:23:14 AM 0 142 0.00 0.01 0.05 0
10:23:15 AM 0 142 0.00 0.01 0.05 0
10:23:16 AM 0 142 0.00 0.01 0.05 0
10:23:17 AM 0 142 0.00 0.01 0.05 0
10:23:18 AM 0 142 0.00 0.01 0.05 0
10:23:19 AM 0 142 0.00 0.01 0.05 0
Average: 0 142 0.00 0.01 0.05 0
回显说明:
指定 -q 后,可以查看运行队列中的进程数、系统上的进程大小、平均负载等信息。与其它命令相比,能查看各项指标随时间变化的情况。<ul>
<li><span><span>runq-sz:运行队列的长度(等待运行的进程数)。</span></span></li>
<li><span><span><span>plist-sz:进程列表中进程(processes)和线程(threads)的数量。</span></span></span></li>
<li><span><span><span><span>ldavg-1:最后 1 分钟的系统平均负载。</span></span></span></span></li>
<li><span><span><span><span><span>ldavg-5:过去 5 分钟的系统平均负载。</span></span></span></span></span></li>
<li><span><span><span><span><span><span>ldavg-15:过去 15 分钟的系统平均负载。</span></span></span></span></span></span></li>
</ul>
</li>
- 查看内存负载
用法:sar -r 1 3
示例输出:
sar -r 1 3
Linux 3.10.0-123.9.3.el7.x86_64 (iZ23pddtofdZ) 07/04/2016 _x86_64_ (1 CPU) 10:27:34 AM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
10:27:35 AM 275992 740664 72.85 181552 315340 362052 35.61 471216 115828 60
10:27:36 AM 276024 740632 72.85 181552 315340 362052 35.61 471220 115828 64
10:27:37 AM 276024 740632 72.85 181552 315340 362052 35.61 471220 115828 64
Average: 276013 740643 72.85 181552 315340 362052 35.61 471219 115828 63回显说明:
- kbmemfree:该值和 free 命令中的 free 值基本一致,它不包括 buffer 和 cache 空间。
- kbmemused:该值和 free 命令中的 used 值基本一致,它包括 buffer 和 cache 空间。
- %memused:物理内存使用率,该值是 kbmemused 和内存总量(不包括 swap)的百分比。
- kbbuffers 和 kbcached:这两个值和 free 命令中的 buffer 和 cache 一致。
- kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap)。
- %commit:该值是 kbcommit 与内存总量(包括swap)的百分比。
- 查看页面交换发生状况
用法:sar -W 1 3
示例输出:
sar -W 1 3
Linux 3.10.0-123.9.3.el7.x86_64 (iZ23pddtofdZ) 07/04/2016 _x86_64_ (1 CPU) 10:28:59 AM pswpin/s pswpout/s
10:29:00 AM 0.00 0.00
10:29:01 AM 0.00 0.00
10:29:02 AM 0.00 0.00
Average: 0.00 0.00回显说明:
- pswpin/s:每秒系统换入的交换页面(swap page)数量。
- pswpout/s:每秒系统换出的交换页面(swap page)数量。
- 其它常见 sar 参数说明(区分大小写)
<ul>
<li><span><span>-A 汇总所有的报告</span></span></li>
<li><span><span><span>-a 报告文件读写使用情况</span></span></span></li>
<li><span><span><span><span>-B 报告附加的缓存的使用情况</span></span></span></span></li>
<li><span><span><span><span><span>-b 报告缓存的使用情况</span></span></span></span></span></li>
<li><span><span><span><span><span><span>-c 报告系统调用的使用情况</span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span>-d 报告磁盘的使用情况</span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span>-g 报告串口的使用情况</span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span>-h 报告关于buffer使用的统计数据</span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span>-m 报告IPC消息队列和信号量的使用情况</span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span>-n 报告命名cache的使用情况</span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span>-p 报告调页活动的使用情况</span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span>-q 报告运行队列和交换队列的平均长度</span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-R 报告进程的活动情况</span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-r 报告没有使用的内存页面和硬盘块</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-u 报告CPU的利用率</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-v 报告进程、i节点、文件和锁表状态</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-w 报告系统交换活动状况</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
<li><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span><span>-y 报告TTY设备活动状况</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></li>
</ul>
</li>
使用 htop 查看系统负载情况
htop 是 Linux 系统中的一个互动进程查看器,可以让用户进行交互式操作,可横向或纵向滚动浏览进程列表,支持鼠标操作。用户可以在安装 htop 来监控服务器的负载。
Linux系统默认不带有 htop 工具,需要手动安装通过 yum install htop 等方法安装后才能使用。安装方法本文不再详述。
安装成功后,可以在命令行输入 htop 来启动 htop 监控工具。htop 启动后的界面如下图所示:
返回结果左侧显示 CPU、内存、交换区 swap 的使用情况,右侧显示任务、负载、开机时间,下面的主体部分就是进程实时状况,底端是 F1-F10 功能键。
相关快捷功能键的说明如下:
功能键 | 对应功能 | 说明 |
F1 | Invoke htop Help | 查看htop帮助说明 |
F2 | Htop Setup Menu | htop 配置菜单 |
F3 | Search for a Process | 搜索进程 |
F4 | Incremental process filtering | 进程过滤器 |
F5 | Tree View | 显示树形结构 |
F6 | Sort by a column | 选择排序方式 |
F7 | Nice - (change priority) | 可减少nice值,用于提高对应进程的优先级 |
F8 | Nice + (change priority) | 可增加nice值,用于降低对应进程的优先级 |
F9 | Kill a Process | 对进程传递信号 |
F10 | Quit htop | 结束htop |
在 htop 界面,用户可以通过鼠标点击相关进程、列、功能键,也可以通过上下键或 PgUP、PgDn 键选定想要的进程,左右键或 Home、 End 键移动字段,常用的快捷键如下:
- Space 标记/取消标记一个或多个进程。
- s 选择某一进程,按 s 后,用 strace 追踪进程的系统调用。
- l 显示进程打开的文件。如果安装了 lsof,按此键可以显示进程所打开的文件。
- M 按 Memory 使用排序。
- P 按 CPU 使用排序。
- T 按 Time+ 使用排序。
- F 跟踪进程: 如果排序顺序引起选定的进程在列表上随意移动,让选定条跟随该进程。这对监视一个进程非常有用。通过这种方式,用户可以让特定进程在屏幕上一直可见。使用方向键会停止该功能。
- K 显示/隐藏内核线程。
- H 显示/隐藏用户线程。
- Ctrl-L 刷新。
鼠标点击 Help 或者按 F1 ,可以显示自带帮助:
鼠标点击 Setup 或者按下 F2 可以进入 htop 配置页面。例如最后一项的设定是调整 Columns(数据列)的显示,用于自定义 htop 进程列表中可以看到哪些字段的数据及信息。
鼠标点击 Search 或者按下 F3 或者输入 "/", 可以通过输入进程名进行搜索,例如搜索 ssh 进程
输入 "t" 或按下 F5,显示树形结构,与 pstree 显示效果类似,可以看到所有程序树状执行的结构。
按下 F6 可以选择依照哪一列来排序,最常用的排序内容就是 CPU 和 Memory。
Linux 系统负载查询及分析说明的更多相关文章
- Linux系统负载查询
查询Linux系统负载情况,一般需要了解三个方面的信息: 1.Linux系统配置.如Linux版本号.CPU.内存.网络.磁盘等: 2.收集系统负载信息的手段.常用的工具包有sysstat和procp ...
- Linux系统负载排查
参考 http://www.ruanyifeng.com/blog/2011/07/linux_load_average_explained.html 在Linux系统中,我们一般使用uptime命 ...
- linux 系统负载高 如何检查
1:load Average 1.1:什么是Load?什么是Load Average? Load 就是对计算机干活多少的度量(WikiPedia:the system Load is a mea ...
- linux系统挂掉问题的分析
玩linux系统,经常遇到的一件事就是做了某个操作之后系统会突然挂掉,这要怎么办? 1. 首先我们要看log,看看是否会留下一些蛛丝马迹,比如PC/LR是否有留下来. PC是ARM的一个寄存器,即程序 ...
- LInux系统木马植入排查分析 及 应用漏洞修复配置(隐藏bannner版本等)
在日常繁琐的运维工作中,对linux服务器进行安全检查是一个非常重要的环节.今天,分享一下如何检查linux系统是否遭受了入侵? 一.是否入侵检查 1)检查系统日志 检查系统错误登陆日志,统计IP重试 ...
- linux中uptime命令查看linux系统负载
阅读目录 uptime cat /proc/loadavg 何为系统负载呢? 进阶参考 uptime 另外还有一个参数 -V(大写),是用来查询版本的 [appdeploy@CNSZ22PL0088: ...
- uptime命令查看系统启动时间和运行时间、查看linux系统负载
1.uptime命令输出:16:11:40 up 59 days, 4:21, 2 users, load average: 0.00, 0.01, 0.00 2.查看/proc/uptime文件计算 ...
- linux uptime-查看Linux系统负载信息
更多linux 性能监测与优化 关注:linux命令大全 uptime命令能够打印系统总共运行了多长时间和系统的平均负载.uptime命令可以显示的信息显示依次为:现在时间.系统已经运行了多长时间.目 ...
- 在windows系统和linux系统中查询IP地址命令的不同
在linux和windows系统上查询IP地址的命令是不一样的. 在linux中的命令行模式下,输入ifconfig即可查询到IP.而在windows系统下要查询IP地址需要先打开do ...
随机推荐
- HTML5为输入框添加语音输入功能
这里介绍的是大家以后要用到的html强大功能,可直接给输入框增加语音功能,下面我们先来看看实现方法. 大家可以看到在输入框右边的麦克风图标,点击麦克风就能够进行语音识别了. 其实很简单,语音识别是ht ...
- 2018-08-27 使用JDT核心库解析JDK源码后初步分析API命名
源自术语词典API项目 · Issue #85 · program-in-chinese/overview, 打算先用早先的代码提取JDK API中的类/方法/参数名, 看看有哪些词需要翻译. 源码在 ...
- Android为TV端助力 浅谈Aidl 通讯机制
服务端: 首先是编写一个aidl文件,注意AIDL只支持方法,不能定义静态成员,并且方法也不能有类似public等的修饰符:AIDL运行方法有任何类型的参数和返回值,在java的类型中,以下的类型使用 ...
- 复杂的字符串数组解析:{"setting":"简单:10:5,一般:5:10,困难:2:20"},使用split多次截取
"[0,{"id":563,"name":"测试题1","dscr":null,"picId&quo ...
- aspectj eclipse4.6下载地址
http://www.eclipse.org/ajdt/downloads/#46zips
- linux 环境变量设置
sudo gedit ~/.bashrc source ~/.bashrc
- IIS ip访问限制插件
Dynamic IP Restrictions Overview The Dynamic IP Restrictions Extension for IIS provides IT Professio ...
- Windows Server 2016-Nano Server介绍
WindowsServer 2016 提供了新的安装选项:Nano Server.Nano Server 是针对私有云和数据中心进行优化的远程管理的服务器操作系统. 类似于 Windows Serve ...
- IE6浏览器无法打开QQ邮箱
原因:未启用TLS1.0 解决方法: 打开IE浏览器,依次打开 [Internet]→[高级],在 设置 选项卡中,勾选[使用TLS1.0],然后点击[确定]保存修改,重启浏览器即可.
- 《生命》第一集:Chanllenge of Life (生命的挑战)
开篇讲的是弗罗里达海岸的海豚用尾巴荡起浑水圈批量捕鱼,肯尼亚的猎豹用集体战术捕猎体积大于自己的鸵鸟,马达加斯加的变色龙用伪装的方式来偷袭昆虫,紧接着讲的是南极洲的食蟹海豹如何从天敌虎鲸的围捕中惊险逃脱 ...