在使用一个工具之前,应该先对它的机制.组成等有深入的了解,以后才会更好的使用它.下面来介绍一下什么是HDFS,以及他的构架是什么样的. 1.什么是HDFS? Hadoop主要是用于进行大数据处理,那么如何有效的存储大规模的数据呢?显然,集中式的物理服务器保存数据是不现实的,其容量.数据传输速度等都会成为瓶颈.那么要实现海量数据的存储,势必要使用十几台.几百台甚至是更多的分布式服务节点.那么,为了统一管理这些节点上存储的数据,必须要使用一种特殊的文件系统——分布式文件系统.HDFS(Hadoop…