MapReduce是一个数据处理的编程模型.这个模型很简单,但也不是简单到不能够支持一些有用的语言.Hadoop能够运行以多种语言写成的MapReduce程序.在这一章中,我们将看看怎样用Java,Ruby,Python语言来写同一个例子.更重要的是,MapReduce程序天生并发运行,这就相当于把能够进行大数据分析的工具交到了某个拥有足够多机器的人手里. 气候数据集 在我们的例子中,将会写一个程序来挖掘天气数据.天气传感器每一个小时都会在全球的许多地方收集数据,并且也收集了大量的日志数据.这些…