http://blog.yufeng.info/archives/751

我们在Linux上总是要保存数据的,数据要么保存在文件系统里(如ext3),要么就在裸设备里面。我们在使用这些数据的时候都是通过文件这个抽象来访问的,操作系统会把我们需要的数据给我们,我们通常无需和块设备打交道。

从下图我们可以很清楚的看到:

我们会发现IO是个层次很深的子系统,有很复杂的数据流动线路。

至于操作系统如何去存储和获取这些数据对我们完全是黑盒子的,这通常不是问题。但是如果我们的IO很密集,我们就需要搞清楚IO具体是如何运作的,免的滥用IO和导致设计问题。

这时候你就需要blktrace这样的工具。

blktrace is a block layer IO tracing mechanism which provides detailed information about request queue operations up to user space.

它的作者Jens Axboe, 是内核IO模块的维护者,目前就职于FusionIO, 是个很nice的家伙,同时他还是著名IO评测工具fio的作者。

相关的文档:
users guide: http://pdfedit.petricek.net/bt/file_download.php?file_id=17&type=bug

HP的人写的指南:http://www.gelato.org/pdf/apr2006/gelato_ICE06apr_blktrace_brunelle_hp.pdf

CU上的小伙子写的: http://linux.chinaunix.net/bbs/viewthread.php?tid=1115851&extra=&ordertype=2

目前blktrace在大部分的Linux发行版都支持的,我们可以轻松的安装使用:

$ sudo yum install blktrace

$ sudo  blktrace /dev/sda5 -o - | blkparse -i -   

  ,                 0.000000000       C   W  +  []
, 0.000040884 A W + <- (,)
, 0.000041214 Q W + [(null)]
, 0.000045947 G W + [(null)]
, 0.000046707 P N [(null)]
, 0.000047073 I W + [(null)]
, 0.000048282 A W + <- (,)
, 0.000048357 Q W + [(null)]
, 0.000049137 M W + [(null)]
, 0.000050167 A W + <- (,)
, 0.000050241 Q W + [(null)]
, 0.000050417 M W + [(null)]
, 0.000050984 A W + <- (,)
, 0.000051047 Q W + [(null)]
, 0.000051258 M W + [(null)]
, 0.000051829 U N [(null)]
, 0.000052699 D W + [(null)]
, 0.000108292 C W + []
, 0.000127791 A W + <- (,)
, 0.000128001 Q W + [(null)]
, 0.000128874 G W + [(null)]
, 0.000129373 P N [(null)]
, 0.000129706 I W + [(null)]
, 0.000130551 U N [(null)]
, 0.000131330 D W + [(null)]
, 0.000172705 C W + []
, 1266874889.709337223 A W + <- (,)
, 1266874889.709338011 Q W + [kjournald]
, 1266874889.709343974 G W + [kjournald]
, 1266874889.709346653 P N [kjournald]
, 1266874889.709347728 I W + [kjournald]
, 1266874889.709350795 U N [kjournald]
, 1266874889.709355396 D W + [kjournald]
, 0.504685570 A W + <- (,)
, 0.504686212 Q W + [kjournald]
, 0.504690614 G W + [kjournald]
, 0.504691826 P N [kjournald]
, 0.504692896 I W + [kjournald]
, 0.504694268 A W + <- (,)
, 0.504694448 Q W + [kjournald]
, 0.504695115 M W + [kjournald]
, 0.504696227 A W + <- (,)
, 0.504696357 Q W + [kjournald]
, 0.504696615 M W + [kjournald]
, 0.504697422 A W + <- (,)
, 0.504697565 Q W + [kjournald]
, 0.504697787 M W + [kjournald]
, 0.504698549 A W + <- (,)
, 0.504698677 Q W + [kjournald]
, 0.504698939 M W + [kjournald]
, 0.504699954 U N [kjournald]
, 0.504704050 D W + [kjournald]
, 0.504810390 C W + []
, 0.504842324 A W + <- (,)
, 0.504842594 Q W + [kjournald]
, 0.504844133 G W + [kjournald]
, 0.504845233 P N [kjournald]
, 0.504845703 I W + [kjournald]
, 0.504846958 U N [kjournald]
, 0.504848547 D W + [kjournald]
, 0.504879109 C W + []
CPU2 (,):
Reads Queued: , 0KiB Writes Queued: , 24KiB
Read Dispatches: , 0KiB Write Dispatches: , 24KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 12KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU13 (,):
Reads Queued: , 0KiB Writes Queued: , 4KiB
Read Dispatches: , 0KiB Write Dispatches: , 4KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 0KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU21 (,):
Reads Queued: , 0KiB Writes Queued: , 20KiB
Read Dispatches: , 0KiB Write Dispatches: , 20KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 16KiB
Read depth: Write depth:
IO unplugs: Timer unplugs: Total (,):
Reads Queued: , 0KiB Writes Queued: , 48KiB
Read Dispatches: , 0KiB Write Dispatches: , 48KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 28KiB
IO unplugs: Timer unplugs: Throughput (R/W): 0KiB/s / 95KiB/s
Events (,): entries
Skips: forward ( - 0.0%)

利用这些信息我们可以很清楚的知道我们IO设备在做什么,花了多少时间,透过它了解我们系统的运作。如何解读这些信息我们可以看手册有详细的解释:

$ man blkparse

同时如果你觉得这些信息太原始,类似btt, seekwatcher这样的工具在blktrace的信息的基础上更深入的挖掘了系统的行为,使用起来也更简单。

我们在实际工作的过程中用blktrace定位了很多问题,比如fsync的延时问题和IO调度器的问题,确实是很实用的一个工具。

祝大家玩的开心。

blktrace 深度了解linux系统的IO运作的更多相关文章

  1. Linux系统 磁盘IO过高排查总结

    最近做的一个电商网站因为磁盘 I/O 过高导致访问速度奇慢,问题存在两个月有余未得到解决办法.此次排查原因的经验可以作下次问题的参考. 1.会看懂 top 系统命令出来的各项参数.此次是无意中发现 u ...

  2. Linux系统:保证数据安全落盘

    在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据.但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer来加速 ...

  3. [转]linux 系统监控、诊断工具之 IO wait

    1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...

  4. Linux系统编程--文件IO操作

    Linux思想即,Linux系统下一切皆文件. 一.对文件操作的几个函数 1.打开文件open函数 int open(const char *path, int oflags); int open(c ...

  5. Linux系统编程@终端IO

    Linux系统中终端设备种类  终端是一种字符型设备,有多种类型,通常使用tty 来简称各种类型的终端设备.终端特殊设备文件一般有以下几种: 串行端口终端(/dev/ttySn ) ,伪终端(/dev ...

  6. linux:关于Linux系统中 CPU Memory IO Network的性能监测

    我们知道:系统优化是一项复杂.繁琐.长期的工作.通常监测的子系统有以下这些:CPUMemoryIO Network 下面是常用的监测工具 Linux 系统包括很多子系统(包括刚刚介绍的CPU,Memo ...

  7. Linux系统IO分析工具之iotstat常用参数介绍

    Linux系统IO分析工具之iotstat常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 1>.安装iostat [root@flume115 ~]# yum - ...

  8. Linux系统IO分析工具之iotop常用参数介绍

      Linux系统IO分析工具之iotop常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的 ...

  9. 操作系统复习——如何查看一个进程的详细信息,如何追踪一个进程的执行过程 ,如何在 Linux 系统下查看 CPU、内存、磁盘、IO、网卡情况?epoll和select区别?

    1. 如何查看一个进程的详细信息,如何追踪一个进程的执行过程 通过pstree命令(根据pid)进行查询进程内部当前运行了多少线程:# pstree -p 19135(进程号) 使用top命令查看(可 ...

随机推荐

  1. HslControls组件库 工业控件库 曲线控件 时间控件 管道控件 温度计控件 阀门控件 传送带控件 进度条控件 电池控件 数码管控件等等

    本篇博客主要对 HslControls 组件做一个大概的总览介绍,更详细的内容可以参照页面里的子链接,还有github上的源代码,然后进行相关的学习,和使用. Prepare 先从nuget下载到组件 ...

  2. App Transfer:苹果允许iOS App从一个开发者帐号转至另一个开发者账号

    App Transfer:苹果允许iOS App从一个开发者帐号转至另一个开发者账号 苹果在WWDC上宣布超过30万的开发者为iOS平台开发超过90万的应用,你可能会想到有人想出售或者购买app. 现 ...

  3. 玩转TypeScript(2) --简单TypeScript类型

    通过TypeScript的Module和Class,TypeScript提供了相对于javaScript更加清晰的代码构造,相较于javaScript的.js满天飞的代码,用TypeScript,你可 ...

  4. opencv-python教程学习系列3-视频操作

    前言 opencv-python教程学习系列记录学习python-opencv过程的点滴,本文主要介绍视频的获取和保存,坚持学习,共同进步. 系列教程参照OpenCV-Python中文教程: 系统环境 ...

  5. UnicodeDammit

    UnicodeDammit 是BS内置库, 主要用来猜测文档编码. 编码自动检测 功能可以在Beautiful Soup以外使用,检测某段未知编码时,可以使用这个方法: from bs4 import ...

  6. JavaScript中实现最高效的数组乱序方法

    数组乱序的意思是,把数组内的所有元素排列顺序打乱. 常用的办法是给数组原生的sort方法传入一个函数,此函数随机返回1或-1,达到随机排列数组元素的目的. 复制代码代码如下: arr.sort(fun ...

  7. C#写的window服务内存溢出

    浅谈c#垃圾回收机制(GC) 写了一个window服务,循环更新sqlite记录,内存一点点稳步增长.三天后,内存溢出.于是,我从自己的代码入手,查找到底哪儿占用内存释放不掉,最终明确是调用servi ...

  8. hive中实现类似MySQL中的group_concat功能

    hive> desc t; OK id      string str     string Time taken: 0.249 seconds hive> select * from t ...

  9. win32 MSG 值

    转自:https://autohotkey.com/docs/misc/SendMessageList.htm WM_NULL = 0x00 WM_CREATE = 0x01 WM_DESTROY = ...

  10. LG3369 【模板】普通平衡树

    题意 您需要写一种数据结构(可参考题目标题),来维护一些数,其中需要提供以下操作: 插入x数 删除x数(若有多个相同的数,因只删除一个) 查询x数的排名(排名定义为比当前数小的数的个数+1.若有多个相 ...