分布式编程相对复杂,而Hadoop本身蒙上大数据.云计算等各种面纱,让很多初学者望而却步.可事实上,Hadoop是一个很易用的分布式编程框架,经过良好封装屏蔽了很多分布式环境下的复杂问题,因此,对普通开发者来说很容易,容易到可以照葫芦画瓢. 大多数Hadoop程序的编写可以简单的依赖于一个模板及其变种.当编写一个新的MapReduce程序时,我们通常采用一个现有的MapReduce程序,通过修改达到我们希望的功能就行了.对于写大部分的Hadoop程序来说几乎就是照葫芦画瓢.这个瓢到底是什么样子呢…