项目介绍 本项目我们使用明星搜索指数数据,分别统计出搜索指数最高的男明星和女明星. 数据集 明星搜索指数数据集,如下图所示.猛戳此链接下载数据集 思路分析 基于项目的需求,我们通过以下几步完成: 1.编写 Mapper类,按需求将数据集解析为 key=gender,value=name+hotIndex,然后输出. 2.编写 Combiner 类,合并 Mapper 输出结果,然后输出给 Reducer. 3.编写 Partitioner 类,按性别,将结果指定给不同的 Reduce 执行. 4…