原文章链接 你肯定听过Hadoop,对就是那头奔跑的小象. 图片描述 Hadoop作为大数据时代代表性的解决方案被大家所熟知,它主要包含两部分内容: HDFS分布式文件存储 MapReduce分布式计算框架 前面我们分析存储方案的发展的时候有提到分布式文件存储的出现是为了解决存储的三大问题:可扩展性,高吞吐量,高可靠性 那么Hadoop的核心HDFS是如何解决上面三个问题的呢? 其实设计一个系统我们要考虑到它的应用场景,然后对它的功能和特性进行设计,做出取舍.我们可能会关注这几个问题: 原始存储…