两个文件,一个是用户的数据,一个是交易的数据. 用户: 交易: 流程如下: 分为以下几个步骤: (1)分别读取user文件和transform文件,并转为两个RDD. * (2)对上面两个RDD执行maptopair操作.生成userpairRdd和transformpairRdd * (3)对transformpairRdd和userpairRdd执行union操作,就是把上面的数据放在一起,生成allRdd * (4)然后把allRdd用groupBykey分组,把同一个UserID的数据都…