Hadoop_MapReduce_03】的更多相关文章

1. MapReduce入门 1.1 MapReduce的思想 MapReduce的思想核心是"分而治之" , 适用于大量的复杂的任务处理场景 (大规模数据处理场景) . Map负责"分" , 即把复杂的任务分解为若干个"简单的任务"来进行处理. 可以进行拆分的前提是这些小任务并行计算, 彼此间几乎没有依赖关系. Reduce负责"合" , 即对map阶段的结果进行全局汇总. 这两个阶段合起来正是MR思想的体现. 1.2 Ma…