1. reduceByKey reduceByKey的作用对像是(key, value)形式的rdd,而reduce有减少.压缩之意,reduceByKey的作用就是对相同key的数据进行处理,最终每个key只保留一条记录,保留一条记录通常,有两种结果:一种是只保留我们希望的信息,比如每个key出现的次数:第二种是把value聚合在一起形成列表,这样后续可以对value做进一步的操作,比如排序. 2. 使用说明 比如现在我们有数据goods Sale:RDD[(String, String)],…