作者: Vivek Gite 译者: LCTT qhwdw

|

sar 命令用用收集、报告、或者保存 UNIX / Linux 系统的活动信息。它保存选择的计数器到操作系统的 /var/log/sa/sadd 文件中。从收集的数据中,你可以得到许多关于你的服务器的信息:

  1. CPU 使用率
  2. 内存页面和使用率
  3. 网络 I/O 和传输统计
  4. 进程创建活动
  5. 所有的块设备活动
  6. 每秒中断数等等

sar 命令的输出能够用于识别服务器瓶颈。但是,分析 sar 命令提供的信息可能比较困难,所以要使用 kSar 工具。kSar 工具可以将 sar 命令的输出绘制成基于时间周期的、易于理解的图表。

sysstat 包

sarsa1、和 sa2 命令都是 sysstat 包的一部分。它是 Linux 包含的性能监视工具集合。

  1. sar:显示数据
  2. sa1 和 sa2:收集和保存数据用于以后分析。sa2 shell 脚本在 /var/log/sa 目录中每日写入一个报告。sa1 shell 脚本将每日的系统活动信息以二进制数据的形式写入到文件中。
  3. sadc —— 系统活动数据收集器。你可以通过修改 sa1 和 sa2 脚本去配置各种选项。它们位于以下的目录:
    • /usr/lib64/sa/sa1 (64 位)或者 /usr/lib/sa/sa1 (32 位) —— 它调用 sadc 去记录报告到 /var/log/sa/sadX 格式。
    • /usr/lib64/sa/sa2 (64 位)或者 /usr/lib/sa/sa2 (32 位) —— 它调用 sar 去记录报告到 /var/log/sa/sarX 格式。

如何在我的系统上安装 sar?

在一个基于 CentOS/RHEL 的系统上,输入如下的 yum 命令 去安装 sysstat:

  1. # yum install sysstat

示例输出如下:

  1. Loaded plugins: downloadonly, fastestmirror, priorities,
  2. : protectbase, security
  3. Loading mirror speeds from cached hostfile
  4. * addons: mirror.cs.vt.edu
  5. * base: mirror.ash.fastserv.com
  6. * epel: serverbeach1.fedoraproject.org
  7. * extras: mirror.cogentco.com
  8. * updates: centos.mirror.nac.net
  9. 0 packages excluded due to repository protections
  10. Setting up Install Process
  11. Resolving Dependencies
  12. --> Running transaction check
  13. ---> Package sysstat.x86_64 0:7.0.2-3.el5 set to be updated
  14. --> Finished Dependency Resolution
  15. Dependencies Resolved
  16. ====================================================================
  17. Package Arch Version Repository Size
  18. ====================================================================
  19. Installing:
  20. sysstat x86_64 7.0.2-3.el5 base 173 k
  21. Transaction Summary
  22. ====================================================================
  23. Install 1 Package(s)
  24. Update 0 Package(s)
  25. Remove 0 Package(s)
  26. Total download size: 173 k
  27. Is this ok [y/N]: y
  28. Downloading Packages:
  29. sysstat-7.0.2-3.el5.x86_64.rpm | 173 kB 00:00
  30. Running rpm_check_debug
  31. Running Transaction Test
  32. Finished Transaction Test
  33. Transaction Test Succeeded
  34. Running Transaction
  35. Installing : sysstat 1/1
  36. Installed:
  37. sysstat.x86_64 0:7.0.2-3.el5
  38. Complete!

为 sysstat 配置文件

编辑 /etc/sysconfig/sysstat 文件去指定日志文件保存多少天(最长为一个月):

  1. # vi /etc/sysconfig/sysstat

示例输出如下 :

  1. # keep log for 28 days
  2. # the default is 7
  3. HISTORY=28

保存并关闭这个文件。

找到 sar 默认的 cron 作业

默认的 cron 作业位于 /etc/cron.d/sysstat

  1. # cat /etc/cron.d/sysstat

示例输出如下:

  1. # run system activity accounting tool every 10 minutes
  2. */10 * * * * root /usr/lib64/sa/sa1 1 1
  3. # generate a daily summary of process accounting at 23:53
  4. 53 23 * * * root /usr/lib64/sa/sa2 -A

告诉 sadc 去报告磁盘的统计数据

使用一个文本编辑器去编辑 /etc/cron.d/sysstat 文件,比如使用 vim 命令,输入如下:

  1. # vi /etc/cron.d/sysstat

像下面的示例那样更新这个文件,以记录所有的硬盘统计数据(-d 选项强制记录每个块设备的统计数据,而 -I 选项强制记录所有系统中断的统计数据):

  1. # run system activity accounting tool every 10 minutes
  2. */10 * * * * root /usr/lib64/sa/sa1 -I -d 1 1
  3. # generate a daily summary of process accounting at 23:53
  4. 53 23 * * * root /usr/lib64/sa/sa2 -A

在 CentOS/RHEL 7.x 系统上你需要传递 -S DISK 选项去收集块设备的数据。传递 -S XALL 选项去采集如下所列的数据:

  1. 磁盘
  2. 分区
  3. 系统中断
  4. SNMP
  5. IPv6
  1. # Run system activity accounting tool every 10 minutes
  2. */10 * * * * root /usr/lib64/sa/sa1 -S DISK 1 1
  3. # 0 * * * * root /usr/lib64/sa/sa1 600 6 &
  4. # Generate a daily summary of process accounting at 23:53
  5. 53 23 * * * root /usr/lib64/sa/sa2 -A
  6. # Run system activity accounting tool every 10 minutes

保存并关闭这个文件。

打开 CentOS/RHEL 版本 5.x/6.x 的服务

输入如下命令:

  1. chkconfig sysstat on
  2. service sysstat start

示例输出如下:

  1. Calling the system activity data collector (sadc):

对于 CentOS/RHEL 7.x,运行如下的命令:

  1. # systemctl enable sysstat
  2. # systemctl start sysstat.service
  3. # systemctl status sysstat.service

示例输出:

  1. ● sysstat.service - Resets System Activity Logs
  2. Loaded: loaded (/usr/lib/systemd/system/sysstat.service; enabled; vendor preset: enabled)
  3. Active: active (exited) since Sat 2018-01-06 16:33:19 IST; 3s ago
  4. Process: 28297 ExecStart=/usr/lib64/sa/sa1 --boot (code=exited, status=0/SUCCESS)
  5. Main PID: 28297 (code=exited, status=0/SUCCESS)
  6. Jan 06 16:33:19 centos7-box systemd[1]: Starting Resets System Activity Logs...
  7. Jan 06 16:33:19 centos7-box systemd[1]: Started Resets System Activity Logs.

如何使用 sar?如何查看统计数据?

使用 sar 命令去显示操作系统中选定的累积活动计数器输出。在这个示例中,运行 sar 命令行,去实时获得 CPU 使用率的报告:

  1. # sar -u 3 10

示例输出:

  1. Linux 2.6.18-164.2.1.el5 (www-03.nixcraft.in) 12/14/2009
  2. 09:49:47 PM CPU %user %nice %system %iowait %steal %idle
  3. 09:49:50 PM all 5.66 0.00 1.22 0.04 0.00 93.08
  4. 09:49:53 PM all 12.29 0.00 1.93 0.04 0.00 85.74
  5. 09:49:56 PM all 9.30 0.00 1.61 0.00 0.00 89.10
  6. 09:49:59 PM all 10.86 0.00 1.51 0.04 0.00 87.58
  7. 09:50:02 PM all 14.21 0.00 3.27 0.04 0.00 82.47
  8. 09:50:05 PM all 13.98 0.00 4.04 0.04 0.00 81.93
  9. 09:50:08 PM all 6.60 6.89 1.26 0.00 0.00 85.25
  10. 09:50:11 PM all 7.25 0.00 1.55 0.04 0.00 91.15
  11. 09:50:14 PM all 6.61 0.00 1.09 0.00 0.00 92.31
  12. 09:50:17 PM all 5.71 0.00 0.96 0.00 0.00 93.33
  13. Average: all 9.24 0.69 1.84 0.03 0.00 88.20

其中:

  • 3 表示间隔时间
  • 10 表示次数

查看进程创建的统计数据,输入:

  1. # sar -c 3 10

查看 I/O 和传输率统计数据,输入:

  1. # sar -b 3 10

查看内存页面统计数据,输入:

  1. # sar -B 3 10

查看块设备统计数据,输入:

  1. # sar -d 3 10

查看所有中断的统计数据,输入:

  1. # sar -I XALL 3 10

查看网络设备特定的统计数据,输入:

  1. # sar -n DEV 3 10
  2. # sar -n EDEV 3 10

查看 CPU 特定的统计数据,输入:

  1. # sar -P ALL
  2. # Only 1st CPU stats
  3. # sar -P 1 3 10

查看队列长度和平均负载的统计数据,输入:

  1. # sar -q 3 10

查看内存和交换空间的使用统计数据,输入:

  1. # sar -r 3 10
  2. # sar -R 3 10

查看 inode、文件、和其它内核表统计数据状态,输入:

  1. # sar -v 3 10

查看系统切换活动统计数据,输入:

  1. # sar -w 3 10

查看交换统计数据,输入:

  1. # sar -W 3 10

查看一个 PID 为 3256 的 Apache 进程,输入:

  1. # sar -x 3256 3 10

kSar 介绍

sar 和 sadf 提供了基于命令行界面的输出。这种输出可能会使新手用户/系统管理员感到无从下手。因此,你需要使用 kSar,它是一个图形化显示你的 sar 数据的 Java 应用程序。它也允许你以 PDF/JPG/PNG/CSV 格式导出数据。你可以用三种方式去加载数据:本地文件、运行本地命令、以及通过 SSH 远程运行的命令。kSar 可以处理下列操作系统的 sar 输出:

  1. Solaris 8, 9 和 10
  2. Mac OS/X 10.4+
  3. Linux (Systat Version >= 5.0.5)
  4. AIX (4.3 & 5.3)
  5. HPUX 11.00+

下载和安装 kSar

访问 官方 网站去获得最新版本的源代码。使用 wget 去下载源代码,输入:

  1. $ wget https://github.com/vlsi/ksar/releases/download/v5.2.4-snapshot-652bf16/ksar-5.2.4-SNAPSHOT-all.jar

如何运行 kSar?

首先要确保你的机器上 JAVA jdk 已安装并能够正常工作。输入下列命令去启动 kSar:

  1. $ java -jar ksar-5.2.4-SNAPSHOT-all.jar

kSar welcome screen

接下来你将看到 kSar 的主窗口,和有两个菜单的面板。

kSar - the main window

左侧有一个列表,是 kSar 根据数据已经解析出的可用图表的列表。右侧窗口将展示你选定的图表。

如何使用 kSar 去生成 sar 图表?

首先,你需要从命名为 server1 的服务器上采集 sar 命令的统计数据。输入如下的命令:

  1. [ server1 ]# LC_ALL=C sar -A > /tmp/sar.data.txt

接下来,使用 scp 命令从本地桌面拷贝到远程电脑上:

  1. [ desktop ]$ scp user@server1.nixcraft.com:/tmp/sar.data.txt /tmp/

切换到 kSar 窗口,点击 “Data” > “Load data from text file” > 从 /tmp/ 中选择 sar.data.txt > 点击 “Open” 按钮。

现在,图表类型树已经出现在左侧面板中并选定了一个图形:

Linux kSar Processes for server1

Linux Disk I/O Stats Using kSar

Linux Memory paging and its utilization stats

放大和缩小

通过移动你可以交互式缩放图像的一部分。在要缩放的图像的左上角点击并按下鼠标,移动到要缩放区域的右下角,可以选定要缩放的区域。返回到未缩放状态,点击并拖动鼠标到除了右下角外的任意位置,你也可以点击并选择 zoom 选项。

了解 kSar 图像和 sar 数据

我强烈建议你去阅读 sar 和 sadf 命令的 man 页面:

  1. $ man sar
  2. $ man sadf

案例学习:识别 Linux 服务器的 CPU 瓶颈

使用 sar 命令和 kSar 工具,可以得到内存、CPU、以及其它子系统的详细快照。例如,如果 CPU 使用率在一个很长的时间内持续高于 80%,有可能就是出现了一个 CPU 瓶颈。使用 sar -x ALL 你可以找到大量消耗 CPU 的进程。

mpstat 命令 的输出(sysstat 包的一部分)也会帮你去了解 CPU 的使用率。但你可以使用 kSar 很容易地去分析这些信息。

找出 CPU 瓶颈后 …

对 CPU 执行如下的调整:

  1. 确保没有不需要的进程在后台运行。关闭 Linux 上所有不需要的服务
  2. 使用 cron 在一个非高峰时刻运行任务(比如,备份)。
  3. 使用 top 和 ps 命令 去找出所有非关键的后台作业/服务。使用 renice 命令 去调整低优先级作业。
  4. 使用 taskset 命令去设置进程使用的 CPU(卸载所使用的 CPU),即,绑定进程到不同的 CPU 上。例如,在 2# CPU 上运行 MySQL 数据库,而在 3# CPU 上运行 Apache。
  5. 确保你的系统使用了最新的驱动程序和固件。
  6. 如有可能在系统上增加额外的 CPU。
  7. 为单线程应用程序使用更快的 CPU(比如,Lighttpd web 服务器应用程序)。
  8. 为多线程应用程序使用多个 CPU(比如,MySQL 数据库服务器应用程序)。
  9. 为一个 web 应用程序使用多个计算节点并设置一个 负载均衡器

isag —— 交互式系统活动记录器(替代工具)

isag 命令图形化显示了以前运行 sar 命令时存储在二进制文件中的系统活动数据。isag 命令引用 sar 并提取出它的数据来绘制图形。与 kSar 相比,isag的选项比较少。

Fig.06: isag CPU utilization graphs

关于作者

本文作者是 nixCraft 的创始人和一位经验丰富的 Linux 操作系统/Unix shell 脚本培训师。他与包括 IT、教育、国防和空间研究、以及非营利组织等全球各行业客户一起合作。可以在 TwitterFacebookGoogle+ 上关注他。


via: https://www.cyberciti.biz/tips/identifying-linux-bottlenecks-sar-graphs-with-ksar.html

使用 sar 和 kSar 来发现 Linux 性能瓶颈的更多相关文章

  1. 应用 Valgrind 发现 Linux 程序的内存问题

    如何定位应用程序开发中的内存问题,一直是 inux 应用程序开发中的瓶颈所在.有一款非常优秀的 linux 下开源的内存问题检测工具:valgrind,能够极大的帮助你解决上述问题.掌握 valgri ...

  2. 应用 Valgrind 发现 Linux 程序的内存问题(转)

    Valgrind 概述 体系结构 Valgrind 是一套Linux下,开放源代码(GPL V2)的仿真调试工具的集合.Valgrind由内核(core)以及基于内核的其他调试工具组成.内核类似于一个 ...

  3. 发现linux主机再用代理上网的情况下不能用wget从外网下载资源

    公司禁网(也不是完全禁,能连接外网数据库,不能下载东西,不能打开网页,但是却能打开谷歌的收索页面,只是不能点进网页) 发现linux主机再用代理上网的情况下不能用wget从外网下载资源,但是却可以从内 ...

  4. [转载]应用 Valgrind 发现 Linux 程序的内存问题

    应用 Valgrind 发现 Linux 程序的内存问题 如何定位应用程序开发中的内存问题,一直是 inux 应用程序开发中的瓶颈所在.有一款非常优秀的 linux 下开源的内存问题检测工具:valg ...

  5. 应用 Valgrind 发现 Linux 程序的内存问题及交叉编译for arm

    Valgrind 概述 体系结构 Valgrind是一套Linux下,开放源代码(GPL V2)的仿真调试工具的集合.Valgrind由内核(core)以及基于内核的其他调试工具组成.内核类似于一个框 ...

  6. 【Linux】Linux 性能瓶颈阈值分析

    Linux系统资源包括:CPU.IO(磁盘和网络).内存等 利用率达到三个阶段时: 1)50% 引起注意 2)70% 密切关注 3)90% 严重情况 vmstat.sar.iostat.mpstat. ...

  7. linux学习(5):linux 性能瓶颈排查

    作为开发人员,肯定遇到过以下场景,应用突然卡住了,或者异常退出,cpu占用过高等各种异常情况,一般遇到这些异常情况,该如何去查找具体原因呢? linux和jdk提供了一些命令和工具来查看内存.cpu. ...

  8. linux性能瓶颈排查--内存+cpu+网络+磁盘+应用瓶颈

    概述 作为运维人员,肯定遇到过以下场景,应用突然卡住了,或者异常退出,cpu占用过高等各种异常情况,一般遇到这些异常情况,该如何去查找具体原因呢? linux和jdk提供了一些命令和工具来查看内存.c ...

  9. 发现linux shell中$0,$?,$!等的特殊用法

    记录下linux shell下的特殊用法及参数的说明 变量说明: $$ Shell本身的PID(ProcessID) $! Shell最后运行的后台Process的PID $? 最后运行的命令的结束代 ...

随机推荐

  1. 常用CSS实例

    为表格设置合并边框模型: border-collapse:collapse 规定单元格之间的空间: cellspacing:0 规定内侧边框的哪个部分是可见的: rules:all

  2. Linux网络子系统

    再Linux的世界里,万物皆文件,通过虚拟文件系统VFS,程序可以用标准的Linux系统调用对不同的文件系统,甚至不同介质上的文件系统进行读写操作.下面我们揭示Linux网络子系统的秘密 sockfs ...

  3. javascript正则表达式获取控制

    正则表达式的元字符是包含特殊含义的字符,他们有一些特殊的功能,可以控制匹配模式的方式,反斜杠后的元字符将失去其特殊含义 单个字符 元字符 匹配情况 . 匹配除换行符外的任意字符 [a-z0-9] 匹配 ...

  4. Spring Boot + MyBatis + Druid + Redis + Thymeleaf 整合小结

    Spring Boot + MyBatis + Druid + Redis + Thymeleaf 整合小结 这两天闲着没事想利用**Spring Boot**加上阿里的开源数据连接池**Druid* ...

  5. git相关的简单命令

    初次使用建议看这个ppt:http://www.bootcss.com/p/git-guide/    从现有仓库克隆 这需要用到 git clone 命令.如果你熟悉其他的 VCS 比如 Subve ...

  6. Windows标准控件

    学习目的 学习创建, 使用Windows标准控件(按钮, 滚动条, 静态控件, 列表框, 编辑框, 组合框); 学习使用子窗口控件操作函数(EnableWindow, MoveWindow, SetW ...

  7. 解决文字和text-decoration:underline下划线重叠问题

    一.text-decoration:underline下划线的问题 CSS text-decoration:underline可以给内联文本增加下划线,但是,如果对细节要求较高,就会发现,下划线经常会 ...

  8. 数据库连接池使用(一):使用C#数据库连接池

         一.导读      使用C#数据库连接池,连接到数据库服务器通常由几个需要软长时间的步骤组成:      1.必须与服务器进行初次连接:      2.必须分析连接字符串信息:      3 ...

  9. 用Jquery去写树结构

    <!DOCTYPEhtml> <html> <head> <metacharset="utf-8"> <title>Tr ...

  10. vue如何实现代码打包分离(按需加载)

    在vue中使用import()来代替require.ensure()实现代码打包分离 一.require.ensure() 方法来实现代码打包分离 require.ensure() 是 webpack ...