MapReduce是Hadoop2.x的一个计算框架,利用分治的思想,将一个计算量很大的作业分给很多个任务,每个任务完成其中的一小部分,然后再将结果合并到一起.将任务分开处理的过程为map阶段,将每个小任务的结果合并到一起的过程为reduce阶段.下面先从宏观上介绍一下客户端提交一个作业时,Hadoop2.x各个组件之间的联系及处理流程.然后我们再具体看看MapReduce计算框架在执行一个作业时,做了些什么. YARN YARN是Hadoop2.x框架下的资源管理系统,其组成部分为: 1)全局…