一.MapReduce简介 1.1MapReduce概述 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题.MR由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce()两个函数,即可实现分布式计算,其执行流程如图1.这两个函数的形参是key.value对,表示函数的输入信息. 图 1 1.1.1 map任务处理 <1> 读取输入文件内容,解析成key.value对.对输入文件的每一行,解析成key.value对.每一个…