一. MR中的join的两种方式: 1.reduce side join(面试题) reduce side join是一种最简单的join方式,其主要思想如下: 在map阶段,map函数同时读取两个文件File1和File2,为了区分两种来源的key/value对,对每条数据打一个标签(tag),比如:tag=1表示来自文件File1,tag=2表示来自文件File2.即:map阶段的主要任务是对不同文件中的数据打标签,在shuffle阶段已经自然按key分组. 在reduce阶段,reduce