K均值(K-Means)算法是一种无监督的聚类学习算法,他尝试找到样本数据的自然类别,分类是K由用户自己定义,K均值在不需要任何其他先验知识的情况下,依据算法的迭代规则,把样本划分为K类.K均值是最常用的聚类技术之一,通过不断迭代和移动质心来完成分类,与均值漂移算法的原理很相似. K均值算法的实现过程: 1. 对于一组未知分类的数据集合,指定其分类数K: 2. 随机分配K个类别的中心点位置,分配的原则是各个类别的中心点距离彼此越远越好. 3.将数据集中的每一个点进行类别划分,划分的距离N个初始的…