YARN是资源管理调度的机制,之前一直以来和MapReduce机制合在一起,之后才分开.正是因为YARN机制单独独立出来,才使得Hadoop框架更加具有普适性.MapReduce可以处理海量离线数据,同样如果处理实时数据,换成Spark,Storm即可,不用重新部署集群,因为资源管理调度YARN是共用的. 当提交一个job,YARN的资源调度如下图所示: YARN有两个比较重要的组成,Resource Manager和Node Manager,执行hadoop jar cn.darren.had