哈喽-各位小伙伴们中秋快乐,好久没更新新的文章啦,今天分享如何使用mapreduce进行join操作. 在离线计算中,我们常常不只是会对单一一个文件进行操作,进行需要进行两个或多个文件关联出更多数据,类似与sql中的join操作. 今天就跟大家分享一下如何在MapReduce中实现join操作 需求 现有两张,一张是产品信息表,一张是订单表.订单表中只表存了产品ID,如果想要查出订单以及产品的相关信息就必须使用关联. 实现 根据MapReduce特性,大家都知道在reduce端,相同key的ke…