一.HDFS介绍 1.1 背景 随着数据量越来越大,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统. 学术一点的定义就是:分布式文件系统是一种允许文件通过网络在多台主机上分享的文件的系统,可让多机器上的多用户分享文件和存储空间.分布式文件管理系统很多,HDFS 只是其中一种.适用于一次写入.多次查询的情况,不支持并发写情况,小文件不合适.因为小文件也占用一个块,小文件越多(1000个