K-Means聚类算法是最为经典的,同时也是使用最为广泛的一种基于划分的聚类算法,它属于基于距离的无监督聚类算法.KMeans算法简单实用,在机器学习算法中占有重要的地位.对于KMeans算法而言,如何确定K值,确实让人头疼的事情. 最近这几天一直忙于构建公司的推荐引擎.对用户群体的分类,要使用KMeans聚类算法,就研究了一下. 探索K的选择 对数据进行分析之前,采用一些探索性分析手段还是很有必要的. 对于高维空间,我们可以采用降维的方式,把多维向量转化为二维向量.好在,R语言包里提供了具体的…