1. MapReduce基本编程模型和框架 1.1 MapReduce抽象模型 大数据计算的核心思想是:分而治之.如下图所示.把大量的数据划分开来,分配给各个子任务来完成.再将结果合并到一起输出.注:如果数据的耦合性很高,不能分离,那么这种并行计算就不合适了. 图1: MapReduce抽象模型 1.2 Hadoop的MapReduce的并行编程模型 如下图2所示,Hadoop的MapReduce先将数据划分为多个key/value键值对.然后输入Map框架来得到新的key/value对,这时候…