很多时候,定义清楚问题比解决问题更难. 什么是MapReduce? 它不是一个产品,而是一种解决问题的思路,它有多个工程实现,Google在论文中也给出了它自己的工程架构实现. MapReduce这个编程模型解决什么问题? 能够用分治法解决的问题,例如: 网页抓取 日志处理 索引倒排 查询请求汇总 … 画外音:能够发现,现实中有许多基于分治的应用需求. 为什么是Google,发明了这个模型? Google网页抓取,分析,倒排的多个应用场景,当时的技术体系,解决不了Google大数据量高并发量的需…