HDFS的概念 HDFS首先是文件系统(FileSystem,FS),尽管这个FS是基于OS原生的文件系统之上:而且这个文件系统是一个抽象概念,HDFS作为一个整体出现,对外(client)隐藏了其内部分分布式文件存储的细节. HDFS的核心概念有三个,完美实现了对于内部复杂性的封装: 首先是数据块:原生的文件系统有数据块的概念,不同的操作系统不一样,大概几千K:硬件上面数据存储也是有数据块,512K.HDFS的数据块则是64M到128M.HDFS之所以这么就是为了减少选址时间(文件小,索引多,