一.概念综述 MapReduce是一种可用于数据处理的编程模型(或计算模型),该模型可以比较简单,但想写出有用的程序却不太容易.MapReduce能将大型数据处理任务分解成很多单个的.可以在服务器集群中并行执行的任务,而这些任务的计算结果可以合并在一起计算最终的结果.最重要的是,MapReduce的优势在于易于编程且能在大型集群(上千节点)并行处理大规模数据集,以可靠,容错的方式部署在商用机器上. 从MapReduce的所有长处来看,它基本上是一个批处理系统,并不适合交互式分析.不可能执行一条查