普遍预测CTR不准,需要校准.例如.boosted trees and SVM预測结果趋于保守.即预測的概率偏向于中值:而对于NaiveBayes预測的概率,小概率趋于更小.大概率趋于更大.经常使用的校准方法有Binning和Pair‐Adjacent Violators (PAV):以下分别说说这两种方法. Binning思想比較简单,也easy实现. 须要说明的是,通常校准算法不不过将概率校准为还有一概率.而是广义地将一分类器的输出score(比如SVM的输出)校准为一概率:这里的score