Hadoop的第一个产品是HDFS,可以说分布式文件存储是分布式计算的基础,也可见分布式文件存储的重要性.如果我们将大数据计算比作烹饪,那么数据就是食材,而Hadoop分布式文件系统HDFS就是烧菜的那口大锅.这些年来,各种计算框架.各种算法.各种应用场景不断推陈出新,让人眼花缭乱,但是大数据存储的王者依然是HDFS. 为什么HDFS的地位如此稳固呢?在整个大数据体系里面,最宝贵.最难以代替的资产就是数据,大数据所有的一切都要围绕数据展开.HDFS作为最早的大数据存储系统,存储着宝贵的数据资产,…