@ 目录 使用场景 优点 具体办法:采用DistributedCache 案例 需求分析 代码实现 使用场景 Map Join 适用于一张表十分小.一张表很大的场景. 优点 思考:在Reduce 端处理过多的表,非常容易产生数据倾斜.怎么办? 在Map端缓存多张表,提前处理业务逻辑,这样增加Map 端业务,减少Reduce 端数据的压力,尽可能的减少数据倾斜. 具体办法:采用DistributedCache (1)在Mapper的setup阶段,将文件读取到缓存集合中. (2)在驱动函数中加载缓…