HDFS 文件块大小 HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( dfs.blocksize)来规定,默认大小在hadoop2.x版本中是128M,老版本中是64M HDFS的块比磁盘的块大,其目的是为了最小化寻址开销.如果块设置得足够大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间.因而,传输一个由多个块组成的文件的时间取决于磁盘传输速率. 如果寻址时间约为10ms,而传输速率为100MB/s,为了使寻址时间仅占传输时间的1%,我们要将块大小设置…