Block是文件块,HDFS中是以Block为单位进行文件的管理的,一个文件可能有多个块,每个块默认是3个副本,这些块分别存储在不同机器上.块与文件之前的映射关系会定时上报Namenode.HDFS中一个块的默认大小是64M,其大小由参数dfs.block.size控制.这里面先引申几个问题出来: 问题1:块大小要怎么设置为一个合理值,过大设置和过小设置有什么影响? 问题2:如果一个文件小于所设置的块大小,实际占用空间会怎样? 问题3:一个Namenode最多能管理多少个块,什么时候会达到瓶颈?