简介 TopN算法是一个经典的算法,由于每个map都只是实现了本地的TopN算法,而假设map有M个,在归约的阶段只有M x N个,这个结果是可以接受的并不会造成性能瓶颈. 这个TopN算法在map阶段将使用TreeMap来实现排序,以到达可伸缩的目的. 当然算法有两种,一种是唯一键,就是说key的类型是唯一的(是指在比较的实际阶段),比如本篇就是唯一键的TopN实现: 另一种就是非唯一键,比如key值可能会有A.B.C三种,然后分别对他们求TopN,当然,我们假设数据是混在一起的,非唯一键方面…