原理解析 KNN-全称K-Nearest Neighbor,最近邻算法,可以做分类任务,也可以做回归任务,KNN是一种简单的机器学习方法,它没有传统意义上训练和学习过程,实现流程如下: 1.在训练数据集中,找到和需要预测样本最近邻的K个实例: 2.分别统计这K个实例所属的类别,最多的那个类别就是样本预测的类别(多数表决法): 对于回归任务而言,则是求这K个实例输出值的平均值(选择平均法): 因此,该算法的几个重点在于: 1.K值的选取,K值的不同直接会导致最终结果的不同: 选择较小的k值,就相当