MD中bitmap源代码分析--设置流程
1. 同步/异步刷磁盘
Bitmap文件写磁盘分同步和异步两种:
1) 同步置位:当盘阵有写请求时,对应的bitmap文件相应bit被置位,bitmap内存页被设置了DIRTY标志。而在下发写请求给磁盘之前,必须保证bitmap文件下刷完成后才向磁盘发送写请求。这种情况需要等待写bitmap磁盘文件完成,因此是同步的。(由bitmap_unplug()完成)
之所以写bit要在写chunk数据之前就同步刷磁盘,因为如果写请求先下发了,而写bit在这之后刷磁盘的话,当写磁盘过程中发生故障,比如掉电,此时数据是不一致的,而磁盘的bitmap文件中由于还没来得及记录写bit在内存中置位的结果,导致之后会错误的认为数据是一致的。在通过bitmap_statrwrite()和bitmap_unplug()两步实现了bitmap中的bit批量下刷的情况下,实现了同步置位,是为了保证正确性。
2) 异步清零:当下发磁盘的写请求完成后,需要将bitmap内存页中相应的bit清零,然后把bitmap文件下刷。而这个过程不需要等待写bitmap磁盘文件完成,因此是异步的。(由bitmap_daemon_work()完成)
而清bit可以在写请求完成之后异步来做,因为就算是写失败,也不会影响正确性,只是会带来一次额外的同步。异步清零的机制好处在于,在还未清零或者内存位图清0但没有刷到磁盘的时候,又有对该页的写请求到来,就只用增加bmc计数器或者只是把内存位图置位,而不用再写到外存的位图文件中,从而减少了一次写外存位图的io。另外,异步清零也实现了bitmap中的bit批量下刷。
2. 写流程Bitmap的设置
在Raid1的写流程中,bitmap的设置操作主要在bitmap_statrwrite()、bitmap_unplug()、bitmap_endwrite()。
bitmap_statrwrite(),该函数在raid1中的make_request()中调用。在提交每个盘的bio到pending_bio_list之前调用该函数。
bitmap_statrwrite()的主要工作:
- 是对写请求的chunk对应bit置1;
- 设置对应bit的bitmap_attr为BITMAP_PAGE_DIRTY;
- 用*bmc来做尚未完成的写请求计数。
具体流程如下图所示:
- 如果是延迟写,则增加延迟写计数;
- 由于一个写操作涉及的数据段可能对应多个数据块(bitmap-chunk指定的大小),对于每个这样的数据块:
a) 获取该数据块的bitmap内存结构,即bp数组指向的内容;
b) 如果该数据块对应的counter达到最大值,说明盘阵上该数据区进行的写访问已经太多,盘阵等待太久,此时需要启动设备的队列处理;
c) 如果该数据块上没有正在进行的写操作(*bmc为0),设置filemap对应的bit,设置该bitmap页对应的bitmap_attr属性为BITMAP_PAGE_DIRTY,计数该页上有多少脏的chunk,将该数据块对应的计数*bmc直接设置为2;
d) 如果该数据块的内存位图已经置位,则将*bmc直接是设置为2;
e) 对应的bmc计数累加。
bitmap_unplug()的主要工作,遍历bitmap的所有filemap页:
- 如果页属性为BITMAP_PAGE_DIRTY,则将该页写入磁盘,同时清除BITMAP_PAGE_DIRTY。等待写入结束后返回。
- 如果页属性为BITMAP_PAGE_NEEDWRITE,则将该页写入磁盘,同时清除BITMAP_PAGE_NEEDWRITE。返回。
这里需要注意的是,如果只有BITMAP_PAGE_NEEDWRITE标记的页,是不需要等待的,因为bit的清除并不是很关键,即使这个信息丢失,最多不过是多余的同步操作而已,没有副作用。而bit的设置,则需要保证写入磁盘的“可靠”后,才能进行盘阵chunk的写入;否则在chunk数据写入磁盘时,对应的bitmap中的bit写入磁盘前,盘阵出现异常,则可能导致数据不一致而bitmap不能发觉。
bitmap_unplug()函数实现了下面两种机制:
实现bitmap同步刷磁盘:
- unplug函数的执行在写下发之前进行。raid1守护进程执行flush_pending_writes(),这个流程首先调用bitmap_unplug()处理,调用generic_make_request()下发chunk数据的写请求;
- bit写盘完全结束之后,才退出unplug函数。页属性BITMAP_PAGE_DIRTY 时,bitmap_unplug()是等待write_page()写盘完成之后才退出的。实现了bitmap同步刷磁盘,确保了数据的可靠性。
实现bitmap批量刷磁盘:
- bitmap_startwrite和bitmap_unplug两步实现。bitmap_unplug要遍历所有bitmap file缓存的page,bitmap_startwrite只针对一次写操作对应的bitmap file缓存的page。
bitmap_endwrite(),写完成后,取出对应数据段的bitmap内存结构:
- COUNT递减;
- 如果COUNT<=2,则设置对应filemap页的BITMAP_PAGE_CLEAN属性;
- 如果有chunk写失败,则设置对应bitmap的*bmc的NEEDED标志。表示需要同步。
具体的函数代码流程如下图所示:
3. 同步流程Bitmap的设置
bitmap_start_sync()。在chunk同步操作开始时,调用该函数。这个函数获取bitmap的内存结构:
- 如果NEEDED标志或者RESYNC标志被设置,就认为该数据块需要同步;
- 此时如果盘阵工作完好,则清除NEEDED标志,设置RESYNC标志;
- 如果NEEDED和RESYNC都没有设置,则认为该数据块不需要同步。
bitmap_end_sync()。chunk同步完成后,调用该函数。这个函数获取bitmap的内存结构:
- 如果RESYNC标志被设置,则清除该标志;
- 如果同步是失败的,则设置NEED位;
- 如果同步成功,并且COUNT<=2,则设置该页属性为BITMAP_PAGE_CLEAN,表示该页存在需要清除的bit位。
转载请注明出处:http://www.cnblogs.com/fangpei/
MD中bitmap源代码分析--设置流程的更多相关文章
- MD中bitmap源代码分析--清除流程
bitmap的清零是由bitmap_daemon_work()来实现的.Raid1守护进程定期执行时调用md_check_recovery,然后md_check_recovery会调用bitmap_d ...
- MD中bitmap源代码分析--入题概述
在MD模块中,各级raid都使用的一份bitmap的源码,也就是说共用一种bitmap的流程,下面以raid1的使用为例来分析bitmap的工作原理. 在使用raid1磁盘阵列的时候,对于数据的可靠性 ...
- MD中bitmap源代码分析--数据结构
本篇分析bitmap的数据结构的设计,并基于此分析bitmap的工作机制. 为了后面更清楚的理解,先有个总体印象,给出整体的结构图: 在下面的描述中涉及到的内容可以对照到上图中相应部分,便于理解. 首 ...
- MD中bitmap源代码分析--SYNC IO和RAID5的补充
最近在做bwraid的R6的设计工作,需要调研一下bitmap下刷磁盘的IO属性(是否为SYNC IO),还有raid5中bitmap的存储和工作方式. 1.bitmap刷磁盘是否为 SYNC IO? ...
- MD中bitmap源代码分析--状态机实例
1. page_attrs的状态转换关系 之前说过,bitmap的优化核心是:bitmap设置后批量写入:bitmap延时清除.写bit用bitmap_statrwrite() + bitmap_un ...
- Raid1源代码分析--同步流程
同步的大流程是先读,后写.所以是分两个阶段,sync_request完成第一个阶段,sync_request_write完成第二个阶段.第一个阶段由MD发起(md_do_sync),第二个阶段由守护进 ...
- Raid1源代码分析--写流程
正确写流程的总体步骤是,raid1接收上层的写bio,申请一个r1_bio结构,将其中的所有bios[]指向该bio.假设盘阵中有N块盘.然后克隆N份上层的bio结构,并分别将每个bios[]指向克隆 ...
- Raid1源代码分析--读流程(重新整理)
五.Raid1读流程分析 两个月前,刚刚接触raid1,就阅读了raid1读流程的代码,那个时候写了一篇博客.现在回过头看看,那篇的错误很多,并且很多地方没有表述清楚.所以还是决定重新写一篇以更正之前 ...
- Raid1源代码分析--读流程
这篇博文不足之处较多,重新整理了一下,链接:http://www.cnblogs.com/fangpei/p/3890873.html 我阅读的代码的linux内核版本是2.6.32.61.刚进实验室 ...
随机推荐
- 轮播图--JS手写
轮播图基本每个网站都会有,也有很多的JQuery插件可以用,这里是用JS代码写的. @{ Layout = null; } <!DOCTYPE html> <html> < ...
- 关于 keybd_event (vb篇)
最近有个VB的项目,做到64位的win7上,传统的VB6.0的sendkeys()函数没法用,可能是由于微软的证书验证机制造成的,于是最常用的一句话指令没法用了“SendKeys "{Hom ...
- MySQL性能调优与架构设计读书笔记
可扩展性设计之数据切分 14.2 数据的垂直切分 如何切分,切分到什么样的程度,是一个比较考验人的难题.只能在实际的应用场景中通过平衡各方面的成本和利益,才能分析出一个真正适合自己的拆分方案. 14. ...
- MySQL数据库备份与恢复方法(转)
来源于:http://www.jb51.net/article/25686.htm 网站数据对我们对站长来说都是最宝贵的,我们平时应该养成良好的备份数据的习惯. 常有新手问我该怎么备份数据库, ...
- 第一个androidAPP项目总结—数据请求
1.使用 ShenBuLuoHttpImpl.getMHttpImpl(context).getAddressList(mod.getCouponCode(), new HttpAfter() { @ ...
- Springmvc整合mybatis
http://blog.csdn.net/geloin/article/details/7536968 http://blog.csdn.net/woshi74/article/details/378 ...
- Oracle 11g随Redhat 5系统自动启动与关闭的设置方法
最近,ORACLE系统基本调试通过,是时候设置ORACLE随RHEL自动启动与关闭服务的时候了,之所以把这个任务放在最后来做,是因为我觉得这个应该不会很难,但真正实施起来,还是遇到了个不小的障碍:写好 ...
- mysql 写数据操作几次硬盘?
mysql 写数据步骤: 1:写入操作事物日志,持久化操作日志到磁盘,并且只是写在磁盘上一小块区域内的顺序io,不需要像随机io一样 在磁盘多个地方移动磁头 2:内存中事物日志持久化以后 ,写入的数 ...
- 启发式算法、寻路算法A*算法
原文链接: http://blog.csdn.net/b2b160/article/details/4057781
- Phpcms v9系统类库与函数库调用方法
在分享了n多phpcms的教程后,cmsyou继续分享关于phpcms v9系统类库与函数库的调用方法. 系统类库位于系统的 /libs/functions目录下面,函数库文件名为*.func.php ...