perf之sched

如果你对你的进程的响应时间极其苛刻，有一天你发现你的进程响应时间变慢了，而恰好这个机器上也有其他的进程在跟你的进程争用CPU，你想看看你的进程被内核调度的情况，那么你需要用perf-sched工具。

Perf sched

Perf sched 有五个子命令：

  perf sched record            # low-overhead recording of arbitrary workloads

  perf sched latency           # output per task latency metrics

  perf sched map               # show summary/map of context-switching

  perf sched trace             # output finegrained trace

  perf sched replay            # replay a captured workload using simlated threads

用户一般使用 perf sched record 收集调度相关的数据，然后就可以用 perf sched latency 查看诸如调度延迟等和调度器相关的统计数据。

其他三个命令也同样读取 record 收集到的数据并从其他不同的角度来展示这些数据。下面一一进行演示。

 perf sched record sleep 10     # record full system activity for 10 seconds

 perf sched latency --sort max  # report latencies sorted by max 

 -------------------------------------------------------------------------------------

  Task               |   Runtime ms  | Switches | Average delay ms | Maximum delay ms |

 -------------------------------------------------------------------------------------

  :14086:14086        |      0.095 ms |        2 | avg:    3.445 ms | max:    6.891 ms |

  gnome-session:13792   |   31.713 ms |      102 | avg:    0.160 ms | max:    5.992 ms |

  metacity:14038      |     49.220 ms |      637 | avg:    0.066 ms | max:    5.942 ms |

  gconfd-2:13971     | 48.587 ms |      777 | avg:    0.047 ms | max:    5.793 ms |

  gnome-power-man:14050 |  140.601 ms | 434 | avg:  0.097 ms | max:    5.367 ms |

  python:14049        |  114.694 ms |      125 | avg:    0.120 ms | max:    5.343 ms |

  kblockd/1:236       |   3.458 ms |      498 | avg:    0.179 ms | max:    5.271 ms |

  Xorg:3122         |   1073.107 ms |     2920 | avg:    0.030 ms | max:    5.265 ms |

  dbus-daemon:2063   |   64.593 ms |      665 | avg:    0.103 ms | max:    4.730 ms |

  :14040:14040       |   30.786 ms |      255 | avg:    0.095 ms | max:    4.155 ms |

  events/1:8         |    0.105 ms |       13 | avg:    0.598 ms | max:    3.775 ms |

  console-kit-dae:2080  | 14.867 ms |   152 | avg:    0.142 ms | max:    3.760 ms |

  gnome-settings-:14023 |  572.653 ms |  979 | avg:    0.056 ms | max:    3.627 ms |

 ...

 -----------------------------------------------------------------------------------

  TOTAL:                |   3144.817 ms |    11654 |

 --------------------------------------------------- 

上面的例子展示了一个 Gnome 启动时的统计信息。

各个 column 的含义如下：

 Task: 进程的名字和 pid

 Runtime: 实际运行时间

 Switches: 进程切换的次数

 Average delay: 平均的调度延迟

 Maximum delay: 最大延迟

这里最值得人们关注的是 Maximum delay，一般从这里可以看到对交互性影响最大的特性：调度延迟，如果调度延迟比较大，那么用户就会感受到视频或者音频断断续续的。

其他的三个子命令提供了不同的视图，一般是由调度器的开发人员或者对调度器内部实现感兴趣的人们所使用。

首先是 map:

  $ perf sched map

  ... 

   N1  O1  .   .   .   S1  .   .   .   B0  .  *I0  C1  .   M1  .    23002.773423 secs

   N1  O1  .  *Q0  .   S1  .   .   .   B0  .   I0  C1  .   M1  .    23002.773423 secs

   N1  O1  .   Q0  .   S1  .   .   .   B0  .  *R1  C1  .   M1  .    23002.773485 secs

   N1  O1  .   Q0  .   S1  .  *S0  .   B0  .   R1  C1  .   M1  .    23002.773478 secs

  *L0  O1  .   Q0  .   S1  .   S0  .   B0  .   R1  C1  .   M1  .    23002.773523 secs

   L0  O1  .  *.   .   S1  .   S0  .   B0  .   R1  C1  .   M1  .    23002.773531 secs

   L0  O1  .   .   .   S1  .   S0  .   B0  .   R1  C1 *T1  M1  .    23002.773547 secs

                       T1 => irqbalance:2089

   L0  O1  .   .   .   S1  .   S0  .  *P0  .   R1  C1  T1  M1  .    23002.773549 secs

  *N1  O1  .   .   .   S1  .   S0  .   P0  .   R1  C1  T1  M1  .    23002.773566 secs

   N1  O1  .   .   .  *J0  .   S0  .   P0  .   R1  C1  T1  M1  .    23002.773571 secs

   N1  O1  .   .   .   J0  .   S0 *B0  P0  .   R1  C1  T1  M1  .    23002.773592 secs

   N1  O1  .   .   .   J0  .  *U0  B0  P0  .   R1  C1  T1  M1  .    23002.773582 secs

   N1  O1  .   .   .  *S1  .   U0  B0  P0  .   R1  C1  T1  M1  .    23002.773604 secs

星号表示调度事件发生所在的 CPU。

点号表示该 CPU 正在 IDLE。

Map 的好处在于提供了一个的总的视图，将成百上千的调度事件进行总结，显示了系统任务在 CPU 之间的分布，假如有不好的调度迁移，比如一个任务没有被及时迁移到 idle 的 CPU 却被迁移到其他忙碌的 CPU，类似这种调度器的问题可以从 map 的报告中一眼看出来。

如果说 map 提供了高度概括的总体的报告，那么 trace 就提供了最详细，最底层的细节报告。

  pipe-test-100k-13520 [001]  1254.354513808: sched_stat_wait:

 task: pipe-test-100k:13521 wait: 5362 [ns]

  pipe-test-100k-13520 [001]  1254.354514876: sched_switch:

 task pipe-test-100k:13520 [120] (S) ==> pipe-test-100k:13521 [120]

          :13521-13521 [001]  1254.354517927: sched_stat_runtime:

 task: pipe-test-100k:13521 runtime: 5092 [ns], vruntime: 133967391150 [ns]

          :13521-13521 [001]  1254.354518984: sched_stat_sleep:

 task: pipe-test-100k:13520 sleep: 5092 [ns]

          :13521-13521 [001]  1254.354520011: sched_wakeup:

 task pipe-test-100k:13520 [120] success=1 [001]

要理解以上的信息，必须对调度器的源代码有一定了解，对一般用户而言，理解他们十分不易。幸好这些信息一般也只有编写调度器的人感兴趣。。。

Perf replay 这个工具更是专门为调度器开发人员所设计，它试图重放 perf.data 文件中所记录的调度场景。很多情况下，一般用户假如发现调度器的奇怪行为，他们也无法准确说明发生该情形的场景，或者一些测试场景不容易再次重现，或者仅仅是出于“偷懒”的目的，使用 perf replay，perf 将模拟 perf.data 中的场景，无需开发人员花费很多的时间去重现过去，这尤其利于调试过程，因为需要一而再，再而三地重复新的修改是否能改善原始的调度场景所发现的问题。

下面是 replay 执行的示例：

 $ perf sched replay

 run measurement overhead: 3771 nsecs

 sleep measurement overhead: 66617 nsecs

 the run test took 999708 nsecs

 the sleep test took 1097207 nsecs

 nr_run_events:        200221

 nr_sleep_events:      200235

 nr_wakeup_events:     100130

 task      0 (                perf:     13519), nr_events: 148

 task      1 (                perf:     13520), nr_events: 200037

 task      2 (      pipe-test-100k:     13521), nr_events: 300090

 task      3 (         ksoftirqd/0:         4), nr_events: 8

 task      4 (             swapper:         0), nr_events: 170

 task      5 (     gnome-power-man:      3192), nr_events: 3

 task      6 (     gdm-simple-gree:      3234), nr_events: 3

 task      7 (                Xorg:      3122), nr_events: 5

 task      8 (     hald-addon-stor:      2234), nr_events: 27

 task      9 (               ata/0:       321), nr_events: 29

 task     10 (           scsi_eh_4:       704), nr_events: 37

 task     11 (            events/1:         8), nr_events: 3

 task     12 (            events/0:         7), nr_events: 6

 task     13 (           flush-8:0:      6980), nr_events: 20

 ------------------------------------------------------------

 #1  : 2038.157, ravg: 2038.16, cpu: 0.09 / 0.09

 #2  : 2042.153, ravg: 2038.56, cpu: 0.11 / 0.09

 ^C

perf之sched的更多相关文章

系统级性能分析工具perf的介绍与使用[转]
测试环境:Ubuntu16.04(在VMWare虚拟机使用perf top存在无法显示问题) Kernel:3.13.0-32 系统级性能优化通常包括两个阶段:性能剖析(performance pro ...
Perf -- Linux下的系统性能调优工具，第 2 部分特殊用法以及内核调优示例
https://www.ibm.com/developerworks/cn/linux/l-cn-perf2/ 本文内容简介之前介绍了 perf 最常见的一些用法,关注于 Linux 系统上应用程序 ...
Linux Perf Probes for Oracle Tracing
Luca Canali on 21 Jan 2016 Topic: this post is about Linux perf and uprobes for tracing and profilin ...
http://blog.csdn.net/zgl07/article/details/43491399
转载申明:本文转载自http://www.brendangregg.com/perf.html 请大家看了之后如果要转载一定要注上这个地址!!! ========================= ...
系统级性能分析工具perf的介绍与使用
测试环境:Ubuntu16.04(在VMWare虚拟机使用perf top存在无法显示问题) Kernel:3.13.0-32 系统级性能优化通常包括两个阶段:性能剖析(performance pro ...
linux perf - 性能测试和优化工具
Perf简介 Perf是Linux kernel自带的系统性能优化工具.虽然它的版本还只是0.0.2,Perf已经显现出它强大的实力,足以与目前Linux流行的OProfile相媲美了. Perf 的 ...
Linux 性能优化工具 perf top
1. perf perf 是一个调查 Linux 中各种性能问题的有力工具. NAME perf - Performance analysis tools for Linux SYNOPSIS per ...
Linux/Android 性能优化工具 perf
/***************************************************************************** * Linux/Android 性能优化工 ...
系统级性能分析工具 — Perf
从2.6.31内核开始,linux内核自带了一个性能分析工具perf,能够进行函数级与指令级的热点查找. perf Performance analysis tools for Linux. Perf ...

随机推荐

protobuf Protocol Buffers 简介案例 MD
Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
CSS3动画的回调处理
我们在做js动画的时候,很多时候都需要做回调处理,如在一个动画完成后触发一个事件.一个动画完成后执行另外一个动画等等,但在使用CSS3动画时能不能捕获到运动的状态做回调处理呢? CSS3动画也是可以做 ...
使用 AutoMapper 映射 IDataReader、DataSet、DataTable 到实体类
AutoMapper是一个.NET的对象映射工具. 项目地址:https://github.com/AutoMapper/AutoMapper. 帮助文档:https://github.com/Aut ...
Linq-排序Order By
适用场景:对查询出的语句进行排序,比如按时间排序等等. 说明:按指定表达式对集合排序:延迟,:按指定表达式对集合排序:延迟,默认是升序,加上descending表示降序,对应的扩展方法是OrderBy ...
IntelliJ IDEA 优化总结
1.修改JVM参数 (IntelliJ IDEA 10.0.1包含以上版本不需要设置) 修改idea.exe.vmoptions配置文件调整以下内容:-Xms256m-Xmx384m-XX:MaxPe ...
Android 原生 Android ActionBar
本文内容关于 ActionBar 必要条件项目结构环境演示一:Action Bar 显示隐藏演示二:Action Item 显示菜单选项演示三:Action Home 启用"返回 ...
提高Mxd地图渲染出图效率的方法
测试在ArcGIS地图渲染非常耗时,特别是标注较多时,下面是做的一些性能测试小结 1.地图渲染的数据量是显示出图速度的关键.主要注意: (1)与数据库存储的数据量关系不大.例如数据库有1万条数 ...
Elasticsearch之集群脑裂
https://www.cnblogs.com/zlslch/p/6477312.html
MSSQL 2005/2008 日志压缩清理方法小结
适用于SQL Server 2005的方法 --------------------------------------------- 复制代码代码如下: USE DNName GO 1,清理日志 ...
Direct hosting of SMB over TCP/IP
http://support.microsoft.com/kb/204279 System TipThis article applies to a different version of Wind ...

perf之sched

perf之sched的更多相关文章

随机推荐

热门专题