(不断更新) MapReduce架构是一种分布式编程架构,它本质上是将任务划分,然后归并.它是以数据为中心的编程架构,相比与分布式计算和并行计算等,它更看重的是吞吐率.它处理的数据是PB级的数据,它并不是新技术,而是一个总结.在数据存储和处理上,它曾经被质疑,被认为是数据库技术的一个倒退,数据库的3个经验: 1.结构描述是好的 2.将结构从程序中分离是好的 3.高阶的访问语言是好的 它一个都不具备,MR编程者需要用到c等低阶语言来处理低阶数据的问题.MR不具备数据斜交的问题,比如数据库中多表查询…