作为Hadoop程序员,他要做的事情就是: 1.定义Mapper,处理输入的Key-Value对,输出中间结果.2.定义Reducer,可选,对中间结果进行规约,输出最终结果.3.定义InputFormat 和OutputFormat,可选,InputFormat将每行输入文件的内容转换为Java类供Mapper函数使用,不定义时默认为String.4.定义main函数,在里面定义一个Job并运行它. 然后的事情就交给系统了. 1.基本概念:Hadoop的HDFS实现了google的GFS文件系