机器学习监督学习中,根据解决问题的连续性和离散型,分为分类问题和回归问题.最邻近算法kNN是一种最为直接和简便的分类方法. kNN本质上,是计算目标到模型的欧式距离,从而判定目标所属的类别. 首先,在解决机器学习问题的时候,我们首先,其实面对这样一个问题:对数据的清洗.因为通常的,我们的程序设计语言,只能处理诸如数组,矩阵,字符,以及其他我们在程序设计中常见的一些数据类型.而通常的,我们手中的数据都是以文件的格式给出.比如.TXT格式的. 所以,首先第一步:完成数据类型的转换: 下面给出一段py