(本文引用了microheart,ggjucheng的一些资料,在此感谢.charles觉得知识无价,开源共享无价) 这一次我们接着分析文件IO校验的相关代码,看看最底层是如何实现这种大数据集的文件校验的,不得不说设计这个系统的程序员是世界上最具有智慧的一群人,面对复杂难解的问题总是可以找到很好的解决方法. 其实对于文件校验这件事情,hadoop为什么重要上一篇文章讲过几个方面,提到的bit rot衰减其实很多人没有直观感受.我就举一个直观的例子以便于普通人感受一下bit rot的影响.一个磁盘…