k近邻(k-NearestNeighbor)算法简称kNN.基本思想简单直接,对于一个需要分类的数据实例x,计算x与所有已知类别的样本点在特征空间中的距离.取与x距离最近的k个样本点,统计这些样本点所属占比最大的类别,作为x的分类结果.下图中与绿色点最近的3个点中,2个属于红色类别,则认为x属于红色的类.然而当k=5时,5个最近的点中有3个是蓝色,则认为绿色点属于蓝色类别. 假如在美国某个小镇上,一户人家最近的二十户邻居里面有十四户华裔,三户非裔,三户美国本土居民.我让你猜这户人家是什么人,我想…