1.算法工作原理 存在一个训练样本集,我们知道样本集中的每一个数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应特征进行比较,然后算法提取样本集中特征最相似的数据(最近邻)的分类标签.一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处.通常k是不大于20的整数. 比如匹配是爱情片,还是动作片,将已知电影和未知电影比较,算出距离 假如k = 3,前三部又是爱情片,所以我们可判定此电影为爱情片. 2.算法流程 1.准备:使用pytho