Linux IO调度算法

 操作系统的调度
CPU调度    CPU scheduler
IO调度       IO scheduler
 
IO调度器的总体目标是希望让磁头能够总是往一个方向移动,移动到底了再往反方向走,这恰恰就是现实生活中的电梯模型,所以IO调 度器也被叫做电梯. (elevator)而相应的算法也就被叫做电梯算法.
而Linux中IO调度的电梯算法有好几种,
  1. as(Anticipatory),
  2. cfq(Complete Fairness Queueing),
  3. deadline,
  4. noop(No Operation).
具体使用哪种算法我们可以在启动的时候通过内核参数elevator来指定.
 
一)I/O调度的4种算法
 1)CFQ(完全公平排队I/O调度程序)
特点:
在最新的内核版本和发行版中,都选择CFQ做为默认的I/O调度器,对于通用的服务器也是最好的选择.
CFQ试图均匀地分布对I/O带宽的访问,避免进程被饿死并实现较低的延迟,是deadline和as调度器的折中.
CFQ对于多媒体应用(video,audio)和桌面系统是最好的选择.
CFQ赋予I/O请求一个优先级,而I/O优先级请求独立于进程优先级,高优先级的进程的读写不能自动地继承高的I/O优先级.
 工作原理:
CFQ为每个进程/线程,单独创建一个队列来管理该进程所产生的请求,也就是说每个进程一个队列,各队列之间的调度使用时间片来调度,
以此来保证每个进程都能被很好的分配到I/O带宽.I/O调度器每次执行一个进程的4次请求.
 
2)NOOP(电梯式调度程序)
特点:
在Linux2.4或更早的版本的调度程序,那时只有这一种I/O调度算法.
NOOP实现了一个简单的FIFO队列,它像电梯的工作主法一样对I/O请求进行组织,当有一个新的请求到来时,它将请求合并到最近的请求之后,以此来保证请求同一介质.
NOOP倾向饿死读而利于写.
NOOP对于闪存设备,RAM,嵌入式系统是最好的选择.
 电梯算法饿死读请求的解释:
因为写请求比读请求更容易.
写请求通过文件系统cache,不需要等一次写完成,就可以开始下一次写操作,写请求通过合并,堆积到I/O队列中.
读请求需要等到它前面所有的读操作完成,才能进行下一次读操作.在读操作之间有几毫秒时间,而写请求在这之间就到来,饿死了后面的读请求.
  
3)Deadline(截止时间调度程序)
 特点:
通过时间以及硬盘区域进行分类,这个分类和合并要求类似于noop的调度程序.
Deadline确保了在一个截止时间内服务请求,这个截止时间是可调整的,而默认读期限短于写期限.这样就防止了写操作因为不能被读取而饿死的现象.
Deadline对数据库环境(Oracle RAC,MySQL等)是最好的选择.
 
4)AS(预料I/O调度程序)
 特点:
本质上与Deadline一样,但在最后一次读操作后,要等待6ms,才能继续进行对其它I/O请求进行调度.
可以从应用程序中预订一个新的读请求,改进读操作的执行,但以一些写操作为代价.
它会在每个6ms中插入新的I/O操作,而会将一些小写入流合并成一个大写入流,用写入延时换取最大的写入吞吐量.
AS适合于写入较多的环境,比如文件服务器
AS对数据库环境表现很差.
  
查看当前系统支持的IO调度算法
  1. dmesg | grep -i scheduler
  2.  
  3. [root@localhost ~]# dmesg | grep -i scheduler
  4. io scheduler noop registered
  5. io scheduler anticipatory registered
  6. io scheduler deadline registered
  7. io scheduler cfq registered (default)

查看当前系统的I/O调度方法:

  1. cat /sys/block/sda/queue/scheduler
  2. noop anticipatory deadline [cfq]

临地更改I/O调度方法:

  1. 例如:想更改到noop电梯调度算法:
  2. echo noop > /sys/block/sda/queue/scheduler

想永久的更改I/O调度方法:

  1. 修改内核引导参数,加入elevator=调度程序名
  2. vi /boot/grub/menu.lst
  3. 更改到如下内容:
  4. kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet

重启之后,查看调度方法:

  1. cat /sys/block/sda/queue/scheduler
  2. noop anticipatory [deadline] cfq
  3. 已经是deadline

  

二 )I/O调度程序的测试
本次测试分为只读,只写,读写同时进行.
分别对单个文件600MB,每次读写2M,共读写300次.

  1. 1)测试磁盘读:
  2. [root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
  3. [root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
  4. 300+0 records in
  5. 300+0 records out
  6. 629145600 bytes (629 MB) copied, 6.81189 seconds, 92.4 MB/s
  7.  
  8. real 0m6.833s
  9. user 0m0.001s
  10. sys 0m4.556s
  11. [root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
  12. [root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
  13. 300+0 records in
  14. 300+0 records out
  15. 629145600 bytes (629 MB) copied, 6.61902 seconds, 95.1 MB/s
  16.  
  17. real 0m6.645s
  18. user 0m0.002s
  19. sys 0m4.540s
  20. [root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
  21. [root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
  22. 300+0 records in
  23. 300+0 records out
  24. 629145600 bytes (629 MB) copied, 8.00389 seconds, 78.6 MB/s
  25.  
  26. real 0m8.021s
  27. user 0m0.002s
  28. sys 0m4.586s
  29. [root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
  30. [root@test1 tmp]# time dd if=/dev/sda1 of=/dev/null bs=2M count=300
  31. 300+0 records in
  32. 300+0 records out
  33. 629145600 bytes (629 MB) copied, 29.8 seconds, 21.1 MB/s
  34.  
  35. real 0m29.826s
  36. user 0m0.002s
  37. sys 0m28.606s

结果:

第一 noop:用了6.61902秒,速度为95.1MB/s
第二 deadline:用了6.81189秒,速度为92.4MB/s
第三 anticipatory:用了8.00389秒,速度为78.6MB/s
第四 cfq:用了29.8秒,速度为21.1MB/s
 
 
2)测试写磁盘:
  1. [root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
  2. [root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
  3. 300+0 records in
  4. 300+0 records out
  5. 629145600 bytes (629 MB) copied, 6.93058 seconds, 90.8 MB/s
  6.  
  7. real 0m7.002s
  8. user 0m0.001s
  9. sys 0m3.525s
  10. [root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
  11. [root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
  12. 300+0 records in
  13. 300+0 records out
  14. 629145600 bytes (629 MB) copied, 6.79441 seconds, 92.6 MB/s
  15.  
  16. real 0m6.964s
  17. user 0m0.003s
  18. sys 0m3.489s
  19. [root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
  20. [root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
  21. 300+0 records in
  22. 300+0 records out
  23. 629145600 bytes (629 MB) copied, 9.49418 seconds, 66.3 MB/s
  24.  
  25. real 0m9.855s
  26. user 0m0.002s
  27. sys 0m4.075s
  28. [root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
  29. [root@test1 tmp]# time dd if=/dev/zero of=/tmp/test bs=2M count=300
  30. 300+0 records in
  31. 300+0 records out
  32. 629145600 bytes (629 MB) copied, 6.84128 seconds, 92.0 MB/s
  33.  
  34. real 0m6.937s
  35. user 0m0.002s
  36. sys 0m3.447s

测试结果:

第一 anticipatory,用了6.79441秒,速度为92.6MB/s
第二 deadline,用了6.84128秒,速度为92.0MB/s
第三 cfq,用了6.93058秒,速度为90.8MB/s
第四 noop,用了9.49418秒,速度为66.3MB/s
 
 
3)测试同时读/写

  1. [root@test1 tmp]# echo deadline > /sys/block/sda/queue/scheduler
  2. [root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
  3. 300+0 records in
  4. 300+0 records out
  5. 629145600 bytes (629 MB) copied, 15.1331 seconds, 41.6 MB/s
  6. [root@test1 tmp]# echo cfq > /sys/block/sda/queue/scheduler
  7. [root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
  8. 300+0 records in
  9. 300+0 records out
  10. 629145600 bytes (629 MB) copied, 36.9544 seconds, 17.0 MB/s
  11. [root@test1 tmp]# echo anticipatory > /sys/block/sda/queue/scheduler
  12. [root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
  13. 300+0 records in
  14. 300+0 records out
  15. 629145600 bytes (629 MB) copied, 23.3617 seconds, 26.9 MB/s
  16. [root@test1 tmp]# echo noop > /sys/block/sda/queue/scheduler
  17. [root@test1 tmp]# dd if=/dev/sda1 of=/tmp/test bs=2M count=300
  18. 300+0 records in
  19. 300+0 records out
  20. 629145600 bytes (629 MB) copied, 17.508 seconds, 35.9 MB/s

测试结果:

第一 deadline,用了15.1331秒,速度为41.6MB/s
第二 noop,用了17.508秒,速度为35.9MB/s
第三 anticipatory,用了23.3617秒,速度为26.9MS/s
第四 cfq,用了36.9544秒,速度为17.0MB/s
 
 
 
三)ionice
ionice可以更改任务的类型和优先级,不过只有cfq调度程序可以用ionice.
 
有三个例子说明ionice的功能:
 
  1. 采用cfq的实时调度,优先级为7
  2. ionice -c1 -n7 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&
  3.  
  4. 采用缺省的磁盘I/O调度,优先级为3
  5. ionice -c2 -n3 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&
  6.  
  7. 采用空闲的磁盘调度,优先级为0
  8. ionice -c3 -n0 -ptime dd if=/dev/sda1 of=/tmp/test bs=2M count=300&

ionice的三种调度方法,实时调度最高,其次是缺省的I/O调度,最后是空闲的磁盘调度.

ionice的磁盘调度优先级有8种,最高是0,最低是7.
 
 
注意,磁盘调度的优先级与进程nice的优先级没有关系.
一个是针对进程I/O的优先级,一个是针对进程CPU的优先级.
 
Anticipatory I/O scheduler                适用于大多数环境,但不太合适数据库应用
 
Deadline I/O scheduler                     通常与Anticipatory相当,但更简洁小巧,更适合于数据库应用
 
CFQ I/O scheduler                            为所有进程分配等量的带宽,适合于桌面多任务及多媒体应用,默认IO调度器
 
Default I/O scheduler

Linux IO调度算法的更多相关文章

  1. MySQL--linux IO调度算法

    ==================================================================== Linux IO调度算法Linux下目前有4中IO调度算法: ...

  2. linux块设备的IO调度算法和回写机制

    ************************************************************************************** 參考: <Linux ...

  3. Linux IO Scheduler(Linux IO 调度器)

    每个块设备或者块设备的分区,都对应有自身的请求队列(request_queue),而每个请求队列都可以选择一个I/O调度器来协调所递交的request.I/O调度器的基本目的是将请求按照它们对应在块设 ...

  4. linux IO调度

    I/O 调度算法再各个进程竞争磁盘I/O的时候担当了裁判的角色.他要求请求的次序和时机做最优化的处理,以求得尽可能最好的整体I/O性能.在linux下面列出4种调度算法CFQ (Completely ...

  5. Linux IO调度器相关算法介绍(转)

    IO调度器(IO Scheduler)是操作系统用来决定块设备上IO操作提交顺序的方法.存在的目的有两个,一是提高IO吞吐量,二是降低IO响应时间.然而IO吞吐量和IO响应时间往往是矛盾的,为了尽量平 ...

  6. IO调度算法研究1

    linux kernel 2.6之后提供了四种IO调度算法,每种调度算法都有其不同的特点和应用场景,系统使用者可以通过系统提供的接口,选择使用哪种IO调度算法,以及调整IO调度算法的参数,以达到最优的 ...

  7. Linux IO 调度器

    Linux IO Scheduler(Linux IO 调度器) 每个块设备或者块设备的分区,都对应有自身的请求队列(request_queue),而每个请求队列都可以选择一个I/O调度器来协调所递交 ...

  8. 【转】linux IO子系统和文件系统读写流程

    原文地址:linux IO子系统和文件系统读写流程 我们含有分析的,是基于2.6.32及其后的内核. 我们在linux上总是要保存数据,数据要么保存在文件系统里(如ext3),要么就保存在裸设备里.我 ...

  9. Linux IO Scheduler(Linux IO 调度器)【转】

    每个块设备或者块设备的分区,都对应有自身的请求队列(request_queue),而每个请求队列都可以选择一个I/O调度器来协调所递交的request.I/O调度器的基本目的是将请求按照它们对应在块设 ...

随机推荐

  1. Oracle 11G RAC For Windows 2008 R2部署手册(亲测,成功实施多次)

    总体规划 服务器规划 1.建议使用两台硬件配置一模一样的服务器来作为 RAC 环境的两个物理节点 2.服务器至少需要配置两块物理网卡 3.服务器规划表: 节点 主机名 本地磁盘大小 操作系统 内存大小 ...

  2. SQLSERVER 修改实例名以及架构信息

    1. GUI的方式 后者是 alter database 的方式修改 instance的名字 2. 在全局的安全性下面创建用户. 3. 在实例的安全性下面创建架构和用户(架构名与用户名一直, 使用新实 ...

  3. 校园网突围之路由器开wifi__windows版

    之前有写过web版的登录介绍,但是有此人给我发邮件说web版的太麻烦,每次都要有内网才可以.在此我要说下web版的好处. 1.不用安装环境,并不是每个人电脑上都需要安装开发环境,你可以说你硬盘空间大, ...

  4. 错误“AxImp.exe”已退出,代码为 -1163019603【转载及个人看法】

    http://blog.csdn.net/duguduchong/article/details/17166123 最近使用vs2010  在重新生成解决方案的时候出现 “AxImp.exe”已退出, ...

  5. Dubbo学习(五) Dubbo 从下载到编译成功

    DUBBO是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,是阿里巴巴SOA服务化治理方案的核心框架,每天为2,000+个服务提供3,000,000,000+次访问量支持,并被广 ...

  6. Java容器深入浅出之HashSet、TreeSet和EnumSet

    Java集合中的Set接口,定义的是一类无顺序的.不可重复的对象集合.如果尝试添加相同的元素,add()方法会返回false,同时添加失败.Set接口包括3个主要的实现类:HashSet.TreeSe ...

  7. 计算机网络【6】—— 从浏览器输入URL到显示页面发生了什么

    当在浏览器地址栏输入网址,如:www.baidu.com后浏览器是怎么把最终的页面呈现出来的呢?这个过程可以大致分为两个部分:网络通信和页面渲染. 一.网络通信 互联网内各网络设备间的通信都遵循TCP ...

  8. Java机器学习框架deeplearing4j入门教程

    1.添加项目maven添加依赖 or 导入jar包 or 使用jvm <project xmlns="http://maven.apache.org/POM/4.0.0" x ...

  9. Qss 样式表的尝试

    QLineEdit{ border:1px solid #137eb6; padding:2px; background-color:#F5F5F5; } QToolTip{ border:1px s ...

  10. python模拟浏览器爬取数据

    爬虫新手大坑:爬取数据的时候一定要设置header伪装成浏览器!!!! 在爬取某财经网站数据时由于没有设置Header信息,直接被封掉了ip 后来设置了Accept.Connection.User-A ...