http://blog.yufeng.info/archives/751

我们在Linux上总是要保存数据的,数据要么保存在文件系统里(如ext3),要么就在裸设备里面。我们在使用这些数据的时候都是通过文件这个抽象来访问的,操作系统会把我们需要的数据给我们,我们通常无需和块设备打交道。

从下图我们可以很清楚的看到:

我们会发现IO是个层次很深的子系统,有很复杂的数据流动线路。

至于操作系统如何去存储和获取这些数据对我们完全是黑盒子的,这通常不是问题。但是如果我们的IO很密集,我们就需要搞清楚IO具体是如何运作的,免的滥用IO和导致设计问题。

这时候你就需要blktrace这样的工具。

blktrace is a block layer IO tracing mechanism which provides detailed information about request queue operations up to user space.

它的作者Jens Axboe, 是内核IO模块的维护者,目前就职于FusionIO, 是个很nice的家伙,同时他还是著名IO评测工具fio的作者。

相关的文档:
users guide: http://pdfedit.petricek.net/bt/file_download.php?file_id=17&type=bug

HP的人写的指南:http://www.gelato.org/pdf/apr2006/gelato_ICE06apr_blktrace_brunelle_hp.pdf

CU上的小伙子写的: http://linux.chinaunix.net/bbs/viewthread.php?tid=1115851&extra=&ordertype=2

目前blktrace在大部分的Linux发行版都支持的,我们可以轻松的安装使用:

$ sudo yum install blktrace

$ sudo  blktrace /dev/sda5 -o - | blkparse -i -   

  ,                 0.000000000       C   W  +  []
, 0.000040884 A W + <- (,)
, 0.000041214 Q W + [(null)]
, 0.000045947 G W + [(null)]
, 0.000046707 P N [(null)]
, 0.000047073 I W + [(null)]
, 0.000048282 A W + <- (,)
, 0.000048357 Q W + [(null)]
, 0.000049137 M W + [(null)]
, 0.000050167 A W + <- (,)
, 0.000050241 Q W + [(null)]
, 0.000050417 M W + [(null)]
, 0.000050984 A W + <- (,)
, 0.000051047 Q W + [(null)]
, 0.000051258 M W + [(null)]
, 0.000051829 U N [(null)]
, 0.000052699 D W + [(null)]
, 0.000108292 C W + []
, 0.000127791 A W + <- (,)
, 0.000128001 Q W + [(null)]
, 0.000128874 G W + [(null)]
, 0.000129373 P N [(null)]
, 0.000129706 I W + [(null)]
, 0.000130551 U N [(null)]
, 0.000131330 D W + [(null)]
, 0.000172705 C W + []
, 1266874889.709337223 A W + <- (,)
, 1266874889.709338011 Q W + [kjournald]
, 1266874889.709343974 G W + [kjournald]
, 1266874889.709346653 P N [kjournald]
, 1266874889.709347728 I W + [kjournald]
, 1266874889.709350795 U N [kjournald]
, 1266874889.709355396 D W + [kjournald]
, 0.504685570 A W + <- (,)
, 0.504686212 Q W + [kjournald]
, 0.504690614 G W + [kjournald]
, 0.504691826 P N [kjournald]
, 0.504692896 I W + [kjournald]
, 0.504694268 A W + <- (,)
, 0.504694448 Q W + [kjournald]
, 0.504695115 M W + [kjournald]
, 0.504696227 A W + <- (,)
, 0.504696357 Q W + [kjournald]
, 0.504696615 M W + [kjournald]
, 0.504697422 A W + <- (,)
, 0.504697565 Q W + [kjournald]
, 0.504697787 M W + [kjournald]
, 0.504698549 A W + <- (,)
, 0.504698677 Q W + [kjournald]
, 0.504698939 M W + [kjournald]
, 0.504699954 U N [kjournald]
, 0.504704050 D W + [kjournald]
, 0.504810390 C W + []
, 0.504842324 A W + <- (,)
, 0.504842594 Q W + [kjournald]
, 0.504844133 G W + [kjournald]
, 0.504845233 P N [kjournald]
, 0.504845703 I W + [kjournald]
, 0.504846958 U N [kjournald]
, 0.504848547 D W + [kjournald]
, 0.504879109 C W + []
CPU2 (,):
Reads Queued: , 0KiB Writes Queued: , 24KiB
Read Dispatches: , 0KiB Write Dispatches: , 24KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 12KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU13 (,):
Reads Queued: , 0KiB Writes Queued: , 4KiB
Read Dispatches: , 0KiB Write Dispatches: , 4KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 0KiB
Read depth: Write depth:
IO unplugs: Timer unplugs:
CPU21 (,):
Reads Queued: , 0KiB Writes Queued: , 20KiB
Read Dispatches: , 0KiB Write Dispatches: , 20KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 0KiB
Read Merges: , 0KiB Write Merges: , 16KiB
Read depth: Write depth:
IO unplugs: Timer unplugs: Total (,):
Reads Queued: , 0KiB Writes Queued: , 48KiB
Read Dispatches: , 0KiB Write Dispatches: , 48KiB
Reads Requeued: Writes Requeued:
Reads Completed: , 0KiB Writes Completed: , 48KiB
Read Merges: , 0KiB Write Merges: , 28KiB
IO unplugs: Timer unplugs: Throughput (R/W): 0KiB/s / 95KiB/s
Events (,): entries
Skips: forward ( - 0.0%)

利用这些信息我们可以很清楚的知道我们IO设备在做什么,花了多少时间,透过它了解我们系统的运作。如何解读这些信息我们可以看手册有详细的解释:

$ man blkparse

同时如果你觉得这些信息太原始,类似btt, seekwatcher这样的工具在blktrace的信息的基础上更深入的挖掘了系统的行为,使用起来也更简单。

我们在实际工作的过程中用blktrace定位了很多问题,比如fsync的延时问题和IO调度器的问题,确实是很实用的一个工具。

祝大家玩的开心。

blktrace 深度了解linux系统的IO运作的更多相关文章

  1. Linux系统 磁盘IO过高排查总结

    最近做的一个电商网站因为磁盘 I/O 过高导致访问速度奇慢,问题存在两个月有余未得到解决办法.此次排查原因的经验可以作下次问题的参考. 1.会看懂 top 系统命令出来的各项参数.此次是无意中发现 u ...

  2. Linux系统:保证数据安全落盘

    在很多IO场景中,我们经常需要确保数据已经安全的写到磁盘上,以便在系统宕机重启之后还能读到这些数据.但是我们都知道,linux系统的IO路径还是很复杂的,分为很多层,每一层都可能会有buffer来加速 ...

  3. [转]linux 系统监控、诊断工具之 IO wait

    1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...

  4. Linux系统编程--文件IO操作

    Linux思想即,Linux系统下一切皆文件. 一.对文件操作的几个函数 1.打开文件open函数 int open(const char *path, int oflags); int open(c ...

  5. Linux系统编程@终端IO

    Linux系统中终端设备种类  终端是一种字符型设备,有多种类型,通常使用tty 来简称各种类型的终端设备.终端特殊设备文件一般有以下几种: 串行端口终端(/dev/ttySn ) ,伪终端(/dev ...

  6. linux:关于Linux系统中 CPU Memory IO Network的性能监测

    我们知道:系统优化是一项复杂.繁琐.长期的工作.通常监测的子系统有以下这些:CPUMemoryIO Network 下面是常用的监测工具 Linux 系统包括很多子系统(包括刚刚介绍的CPU,Memo ...

  7. Linux系统IO分析工具之iotstat常用参数介绍

    Linux系统IO分析工具之iotstat常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 1>.安装iostat [root@flume115 ~]# yum - ...

  8. Linux系统IO分析工具之iotop常用参数介绍

      Linux系统IO分析工具之iotop常用参数介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的 ...

  9. 操作系统复习——如何查看一个进程的详细信息,如何追踪一个进程的执行过程 ,如何在 Linux 系统下查看 CPU、内存、磁盘、IO、网卡情况?epoll和select区别?

    1. 如何查看一个进程的详细信息,如何追踪一个进程的执行过程 通过pstree命令(根据pid)进行查询进程内部当前运行了多少线程:# pstree -p 19135(进程号) 使用top命令查看(可 ...

随机推荐

  1. P1174 互素

    P1174 互素 时间: 1000ms / 空间: 131072KiB / Java类名: Main 描述 对于某个数n,,我们这次的工作仅是求出小于n且和n互质的数的个数,,比如n=10时 1,3, ...

  2. Linux文件共享(单进程之间、多进程之间)

    转载:https://www.cnblogs.com/frank-yxs/p/5925603.html 在同一个进程中,实现文件共享的方法有两种: 多次使用open函数打开相同文件 使用dup/dup ...

  3. 牛客多校第五场 J:Plan

    链接:https://www.nowcoder.com/acm/contest/143/J 来源:牛客网 时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 262144K,其他语言524 ...

  4. 51Nod:1268 和为K的组合

    1268 和为K的组合  基准时间限制:1 秒 空间限制:131072 KB 分值: 20 难度:3级算法题  收藏  关注 给出N个正整数组成的数组A,求能否从中选出若干个,使他们的和为K.如果可以 ...

  5. Let the Balloon Rise map一个数组

    Contest time again! How excited it is to see balloons floating around. But to tell you a secret, the ...

  6. CTF-练习平台-Misc之 Telent

    三.Telent 下载下来文件,解压压缩包,用记事本打开pcap文件,发现flag

  7. 转-Hive/Phoenix + Druid + JdbcTemplate 在 Spring Boot 下的整合

    Hive/Phoenix + Druid + JdbcTemplate 在 Spring Boot 下的整合 http://blog.csdn.net/balabalayi/article/detai ...

  8. ehci及其伴随ohci主机控制器驱动分析

    1. 正常插入 插上U盘产生中断调用usb_hcd_irq: usb_hcd_irq ehci_irq usb_hcd_resume_root_hub queue_work(pm_wq, &h ...

  9. loopback v4 特性

    loopback 是一个api 服务框架,挺方便的,同时也已经演进了好几代了v4 有一些新功能的 支持 新特性 基于typescript/es2017 开发 openapi 驱动的rest api 开 ...

  10. 监控Linux的Steps&Q&A

    spolight的下载地址:https://www.quest.com/spotlight-on-windows/ 问题1.sar -u 之后,只有一条记录.这种情况执行一下:sudo sar -d; ...