Hadoop的MapReduce程序提交到集群环境中运行,出问题时定位非常麻烦,有时需要一遍遍修改代码和打印日志来排查问题,哪怕是比较小的问题.如果数据量很大的话调试起来就相当耗费时间. 而且,Map和Reduce的一些参数是Hadoop框架在运行时传入的,比如Context.InputSplit,这进一步增加了调试的难度.如果有一个良好的单元测试框架能帮助尽早发现.清除bug,那就太好了. MRUnit 框架 MRUnit是Cloudera公司专为Hadoop MapReduce写的单元测试框…