1.首先需要一些训练样本集,例如一道问题(数据)及答案(标签),可以看做一条样本,那么多条,就是样本集 当然这里应该是一条数据及该数据所属的分类,该类别称为标签 2.现在我们已经知道数据与所属类别的对应关系 3.那么当我们想要输入一条数据时,就可以通过KNN算法,根据已知的对应关系,判断该数据的类别. 具体步骤如下: 1.收集训练样本集(数据<->类别) 2.输入所要判断的数据 3.计算该数据与训练样本的距离 4.将这些距离升序排列,取前K条训练样本,这就是kNN,k的出处 5.统计这k条训练…