MapReduce主要包括两个阶段:一个是Map,一个是Reduce. 每一步都有key-value对作为输入和输出. Map阶段的key-value对的格式是由输入的格式决定的,如果是默认的TextInputFormat,则每行作为一个记录进程处理,其中key为此行的开头相对文件的起始位置,value就是此行的字符文本.Map阶段的输出的key-value对的格式必须同reduce阶段的输入key-value对的格式相对应. 下面开始尝试,假设我们需要处理一批有关天气的数据,其格式如下: 按照…