MapReduce是什么 MapReduce是一种分布式计算编程框架,是Hadoop主要组成部分之一,可以让用户专注于编写核心逻辑代码,最后以高可靠.高容错的方式在大型集群上并行处理大量数据. MapReduce的存储 MapReduce的数据是存储在HDFS上的,HDFS也是Hadoop的主要组成部分之一.下边是MapReduce在HDFS上的存储的图解 HDFS主要有Namenode和Datanode两部分组成,整个集群有一个Namenode和多个DataNode,通常每一个节点一个Data…